[修订 说 明 ] 
仅仅 为 了 掌上 书 苑 制作 :1 


第 一 次 修订 。 改 正 了 文中 的 大 部 分 错别字 和 格式 错误 ， 并 对 一 些 句 子 依 
照 中 文 的 习惯 进行 了 改写 。 


[ 译 序 ] 


那些 自 认 为 已 经 “学 完 ”C 语 言 的 人 ， 请 你 们 和 仔细 读 阅 读 这 篇 文章 吧 。 路 
还 长 ， 很 多 东西 要 学 。 我 也 是 .……. 


[概述 ] 


C 语 言 像 一 把 雕刻 万， 锋利， 0 和 任何 锋利 的 
工具 一 样 ，C 会 伤 到 那些 不 能 掌握 它 的 人 。 本 文 介绍 C 语 言 伤 害 粗心 的 
人 的 方法 ， 以 及 如 何 避 免 伤害 。 


[内 容 ] 


0 简介 


5 库 函 数 
6 了 预 处 理 器 


7 可 移植 性 缺陷 


1 词法 缺陷 


编译 器 的 第 一 个 部 分 常 被 称 为 词法 分 析 器 (lexical analyzer) 。 词 法 分 
析 器 检查 组 成 程序 的 字符 序列 ， 并 将 它们 划分 为 记号 〈token) 一 个 记 
号 是 一 个 由 一 个 或 多 个 字符 构成 的 序列 ， 它 在 语言 被 编译 时 具有 一 个 
《相关 地 ) 统一 的 意义 。 在 C 中 ， 例如 ， 记 号 -> 的 意义 和 组 成 它 的 每 个 
独立 的 字符 具有 明显 的 区 别 ， 而 且 其 意义 独立 于 -> 出 现 的 上 下 文 环境 。 


为 外 一 个 例子 ， 考 虑 下 面 的 语句 : 
if(x > big) big = x; 


该 语句 中 的 每 一 个 分 离 的 字符 都 被 划分 为 一 个 记号 ， 除 了 关键 字 让 和 标 
识 符 big 的 两 个 实例 。 


事实 上 ，C 程 序 被 两 次 划分 为 记 写 。 首 先是 预 处 理 费 读 取 程序 。 它 必须 
对 程序 进行 记号 划分 以 发 现 标 识 宏 的 标识 符 。 它 必须 通过 对 每 个 宏 进行 
求 值 来 蔡 换 宏 调 用 。 最 后 ， 经 过 宏 丛 换 的 程序 又 被 汇集 成 字符 流 送 给 编 
译 句 。 编 译 器 再 第 二 次 将 这 个 流 划 分 为 记号 。 


在 这 一 节 中 ， 我 们 将 探索 对 记号 的 意义 的 普遍 的 误解 以 及 记号 和 组 成 它 
们 的 字符 之 间 的 关系 。 稍 后 我 们 将 谈 到 预 处 理 絮 。 
1.1 = 不 是 == 


从 Algol 派 生出 来 的 语言 ， 如 Pascal 和 Ada， 用 := 表示 赋值 而 用 = 表示 比 
较 。 而 C 语 言 则 是 用 = 表示 赋值 而 用 == 表 示 比 较 。 这 是 因为 赋值 的 频率 
要 高 于 比较 ， 因 此 为 其 分 配 更 短 的 符号 。 


此 外 ，C 还 将 赋值 视 为 一 个 运算 符 ， 因 此 可 以 很 容易 地 写 出 多 重 赋值 
Ca=b=c) ， 并 且 可 以 将 赋值 谋 入 到 一 个 大 的 表达 式 中 。 


这 种 便捷 导致 了 一 个 潜在 的 问题 : 可 能 将 需要 比较 的 地 方 写 成 赋值 。 
此 ， 下 面 的 语句 好 像 看 起 来 是 要 检查 x 是 否 等 于 y: 


if(x = y) 
foo(); 


而 实际 上 是 将 设置 为 y 的 值 并 检查 结果 是 否 非 零 。 再 考虑 下 面 的 一 个 布 
望 跳 过 空格 、 制 表 答 和 换行 符 的 循环 : 


while(c ==" "||c="\t ||c== AN) 


c= getc(f); 


在 与 进行 比较 的 地 方程 序 员 错 误 地 使 用 = 代 蔡 了 ==。 这 个 “比较 ”实际 
上 是 将 Wt 赋 给 c， 然 后 判断 c 的 (新 的 ) 值 是 否 为 零 。 因 为 Y 不 为 零 ， 这 
个 “比较 ”将 一 直 为 真 ， 因 此 这 个 循环 会 吃 尽 整个 文件 。 这 之 后 会 发 生 什 
么 取决 于 特定 的 实现 是 否 允许 一 个 程序 读 取 超过 文件 尾部 的 部 分 。 如 于 
允许 ， 这 个 循环 会 一 直 运 行 。 


一 些 C 编 译 器 会 对 形 如 el = e2 的 条 件 给 出 一 个 警告 以 提醒 用 户 。 当 你 确 
实 需要 先 对 一 个 变量 进行 赋值 之 后 再 检查 变量 是 否 非 零 时 ， 为 了 在 这 种 
编译 器 中 避免 敬告 信息 ， 应 考虑 显 式 给 出 比较 符 。 换 句 话说 ， 将 : 


if(x = y) 

foo(); 

改写 为 : 

if((x = y) != 0) 

foo(); 

这 样 可 以 清晰 地 表示 你 的 意图 。 

1.2& 和 | 不 是 && 和 | 

容易 将 == 错 写 为 = 是 因为 很 多 其 他 语言 使 用 = 表示 比较 运算 。 其 他 容易 
写 错 的 运算 符 还 有 && 和 &&， 以 及 | 和 上 |， 这 主要 是 因为 C 语 言 中 的 & 和 | 运 


算 符 于 其 他 语言 中 具有 类 似 功 能 的 运算 符 大 为 不 同 。 我 们 将 在 第 4 节 中 
贴近 地 观察 这 些 运算 符 。 


1.3 多 字符 记号 

一 些 C 记 号 ， 如 /、* 和 = 只 有 一 个 字符 。 而 其 他 一 些 C 记 号 ， 如 /* 和 ==， 

以 及 标识 符 ， 具 有 多 个 字符 。 当 C 编 译 器 过 到 紧 连 在 一 起 的 /和 * 时 ， 它 
必须 能 够 决定 是 将 这 两 个 字符 识别 为 两 个 分 离 的 记号 还 是 一 个 单独 的 记 
号 。C 语 言 参 考 手 册 说 明了 如 何 决 定 :“ 如 果 输 入 流 到 一 个 给 定 的 字符 串 
为 止 已 经 被 识别 为 记号 ， 则 应 该 包含 下 一 个 字符 以 组 成 能 够 构成 记号 的 
最 长 的 字符 串 ”([ 译 注 ] 即 通常 所 说 的 “最 长 子 串 原则 ”*) 。 因 此 ， 如 果 / 
是 一 个 记号 的 第 一 个 字符 ， 并 且 / 后 面 紧 随 了 一 个 *， 则 这 两 个 字符 构成 
了 注释 的 开始 ， 不 管 其 他 上 下 文 环 境 。 


下 面 的 语句 看 起 来 像 是 将 y 的 值 设置 为 x 的 值 除 以 p 所 指向 的 值 : 

y= XxX/*p /* pp 指 问 除数 */; 

实际 上 ，A# 开 始 了 一 个 注释 ， 因 此 编译 器 简单 地 吞噬 程序 文本 ， 直 到 次 
的 出 现 。 换 句 话 说， 这 条 语句 仅仅 把 y 的 值 设置 为 x 的 值 ， 而 根本 没有 看 
到 p。 将 这 条 语句 重 写 为 : 

y=X/*p/*p 指向 除数 */; 

或 者 干脆 是 

y=X/(*p)/#*p 指 向 除数 */; 

它 就 可 以 做 注释 所 暗示 的 除法 了 。 


这 种 模棱两可 的 写法 在 其 他 环境 中 惑 会 引起 肪 烦 。 例 如 ， 老 版 本 的 C 使 
用 =+ 表 示 现 在 版 本 中 的 +=。 这 样 的 编译 器 会 将 


a=-1; 
视 为 
a =-1; 


的 程序 员 感 到 吃惊 。 男 一 方面 ， 这 种 老 版 本 的 C 编 译 器 会 将 


a =/ *b; 
尽管 看 起 来 像 一 个 注释 。 


1.4 例外 


组 合 赋值 运算 符 如 += 实 际 上 有 是 两 个 记号 。 因 此 ， 


at+/* strange */=1 
和 
a+= 1 


是 一 个 意思 。 看 起 来 像 一 个 单独 的 记号 而 实际 上 是 多 个 记号 的 只 有 这 一 
个 特例 。 特 别 地 ， 


p->a 

是 不 合法 的 。 它 和 
p->a 
不 是 同义词 。 


为 一 方面 ， 有 些 老 式 编译 器 还 是 将 =+ 视 为 一 个 单独 的 记号 并 且 和 += 是 
同义词 。 


1.5 字符 串 和 字符 


单 引 号 和 双 引 号 在 C 中 的 意义 完全 不 同 ， 在 一 些 混乱 的 上 下 文中 它们 会 
导致 奇怪 的 结果 而 不 古 错误 消 乱 。 

包围 在 单 引 号 中 的 一 个 字符 只 是 编写 整数 的 为 一 种 方法 。 这 个 整数 是 给 
定 的 字符 在 实现 的 对 照 序列 中 的 一 个 对 应 的 值 。 因 此 ， 在 一 个 ASCII 实 
现 中 ，'a 和 0141 或 97 表 示 完 全 相同 的 东西 。 而 一 个 包围 在 双 引 号 中 的 字 
符 吝 ， 只 是 编写 一 个 有 双 引 号 之 间 的 字符 和 一 个 附加 的 二 进 制 值 为 零 的 
字符 所 初始 化 的 一 个 无 名 数组 的 指针 的 一 种 简短 方法 。 


下 面 的 两 个 程序 片断 是 等 价 的 : 


printf("Hello world\n"); 


char hello|| 二 { HH, 和， 1", 1 "0 T 由 WwW, "0 了 工 ， 1", 'd", "\n, 0 上 
printf(hello); 
使 用 一 个 指针 来 代 伏 一 个 整数 通常 会 得 到 一 个 警告 消 奶 (反之 亦 然 〉， 


使 用 双 引 号 来 代 丛 单 引 号 也 会 得 到 一 个 警告 消息 《反之 亦 然 〉。 但 对 于 
不 检查 参数 类 型 的 编译 项 却 除外 。 因 此 ， 用 


printf(\n'); 
RT 
printf("\n"); 


通常 会 在 运行 时 得 到 奇怪 的 结果 。 [译注 ] 提 示 : 正如 上 面 所 说 ，"\n' 表 
eo 
义 的 呈 : 


由 于 一 个 整数 通常 足够 大 ， 以 至 于 能 够 放下 多 个 字符 ， 一 些 C 编 译 器 允 
许 在 一 个 字符 第 量 中 存放 多 个 字符 。 这 意味 着 用 'yes' 代 玲 "yes" 将 不 会 锐 
发 现 。 后 者 意味 着 “分 别 包 含 y、e、s 和 一 个 空 字 符 的 四 个 连续 存储 器 区 
域 中 的 第 一 个 的 地 址 *”， 而 前 者 意味 着 “在 一 些 实现 定义 的 样式 中 表示 由 
字符 y、e、s 联 合 构成 的 一 个 整数 "。 这 两 痢 之 间 的 任何 一 致 性 都 纯 属 三 


口 


2 句法 缺陷 
要 理解 C 语 言 程序 ， 仅 了 解构 成 它 的 记号 是 不 够 的 。 还 要 理解 这 些 记 号 
是 如 何 构 成 声明 、 表 达 式 、 语 句 和 程序 的 。 尺 管 这 些 构成 通常 都 是 定义 
良好 的 ， 但 这 些 定义 有 时 候 是 有 屠 于 直觉 的 或 混乱 的 。 
在 这 一 节 中 ， 我 们 将 着 眼 于 一 些 不 明显 句法 构造 。 

2.1 理解 声明 
我 曾经 和 一 些 人 聊 过 天 ， 他 们 那 时 正在 在 编写 在 一 个 小 型 的 微 处 理 器 上 
单机 运行 的 C 程 序 。 当 这 人 台 机 器 的 开关 打开 的 时 候 ， 硬 件 会 调用 地 址 为 0 
处 的 子 程序 。 


为 了 模仿 电源 打开 的 情形 ， 我 们 要 设计 一 条 C 语 句 来 显 式 地 调用 这 个 子 
程序 。 经 过 一 些 思考 ， 我 们 写 出 了 下 面 的 语句 : 


C*(void*)O)0)0; 


这 样 的 表达 式 会 令 C 程 序 员 心 慰 胆 战 。 但 是 ， 并 不 需要 这 样 ， 因 为 他 们 
可 以 在 一 个 简单 的 规则 的 帮助 下 很 容易 地 构造 它 : 以 你 使 用 的 方式 声明 
人 


每 个 C 变 量 声明 都 具有 两 个 部 分 : 一 个 类 型 和 一 组 具有 特定 格式 的 、 期 
望 用 来 对 该 类 型 求 值 的 表达 式 。 最 简单 的 表达 式 就 是 一 个 变量 : 


float f, g; 


说 明 表 达 式 f 和 g 一 一 在 求 值 的 时 候 一 一 具有 类 型 float。 由 于 等 求 值 的 是 
表达 式 ， 因 此 可 以 目 由 地 使 用 圆 括号 : 


float ((f)); 

这 表示 (() 求 值 为 foat 并 且 因 此 ， 通 过 推 亲 ，f 也 是 一 个 float。 
同样 的 逻辑 用 在 函数 和 指针 类型 。 例 如 : 

float ff(); 


表示 表达 式 ff0) 是 一 个 float， 因 此 任 是 一 个 返回 一 个 float 的 函数 。 类 似 
地 ， 


float *pf; 

表示 *pf 是 一 个 float 并 且 因 此 pf 是 一 个 指 癌 一 个 float 的 指针 。 

这 些 形 式 的 组 合 声明 对 表达 式 是 一 样 的 。 因 此 ， 

float *g(), (*h)(); 

表示 *g() 和 (*h)0 都 是 float 表 达 式 。 由 于 0O 比 * 绑 定 得 更 紧密 ，*g() 和 *(g()) 
表示 同样 的 东西 : g 是 一 个 返回 指 float 指 针 的 函数 ， 而 h 是 一 个 指向 返回 
float 的 函数 的 指针 。 

当 我 们 知道 如 何 声明 一 个 给 定 类 型 的 变量 以 后 ， 就 能 够 很 容易 地 写 出 一 
个 类 型 的 模型 〈cast) : 只 要 删除 变量 名 和 分 号 并 将 所 有 的 东西 包围 在 
一 对 圆 括 号 中 即 可 。 因 此 ， 由 于 

float *g(); 

声明 g 是 一 个 返回 float 指 针 的 函数 ， 所 以 (float *(O) 就 是 它 的 模型 。 

有 了 这 些 知识 的 武装 ， 我 们 现在 可 以 准备 解决 (*(void(*)0)0)0 了 。 我 们 
可 以 将 它 分 为 两 个 部 分 进行 分 析 。 首 先 ， 假 设 我 们 有 一 个 变量 fp， 它 包 
含 了 一 个 函数 指针 ， 并 且 我 们 希望 调用 fp 所 指向 的 函数 。 可 以 这 样 写 : 

(*fp)O; 

如 果 印 是 一 个 指向 函数 的 指针 ， 则 *fp 就 是 函数 本 身 ， 因 此 (*fp)0 是 调用 
它 的 一 种 方法 。(*fp) 中 的 括号 是 必须 的 ， 和 否则 这 个 表达 式 将 会 被 分 析 为 
*(fpO)。 我 们 现在 要 找 一 个 适当 的 表达 式 来 奉 换 fp。 


这 个 问题 就 是 我 们 的 第 二 步 分 析 。 如 果 C 可 以 读 入 并 理解 类 型 ， 我 们 可 
以 与 : 


(0)0; 
但 这 样 并 不 行 ， 因 为 * 运 算 符 要 求 必须 有 一 个 指针 作为 它 的 操作 数 。 另 


外 ， 这 个 操作 数 必须 是 一 个 指向 函数 的 指针 ， 以 保证 * 的 结果 可 以 被 调 
用 。 因 此 ， 我 们 需要 将 0 转换 为 一 个 可 以 描述 “ 指 疝 一 个 返回 void 的 函数 
的 指针 ”的 类 型 。 


如 果 甸 是 一 个 指向 返回 void 的 函数 的 指针 ， 则 (*fp)0 是 一 个 void 值 ， 并 且 
它 的 声明 将 会 是 这 样 的 : 


void (*fp)O; 

因此 ， 我 们 需要 与 : 

void (*fp)O; 

(*fp)O; 

来 声明 一 个 哑 变 量 。 一 旦 我 们 知道 了 如 何 声明 该 变量 ， 我 们 也 就 知道 了 
如 何 将 一 个 常数 转换 为 该 类 型 ;只 要 从 变量 的 声明 中 去 掉 名 字 即 可 。 
此 ， 我 们 像 下 面 这 样 将 0 转换 为 一 个 “ 指 癌 返回 void 的 函数 的 指针 ”: 
(void(*)O)0 

接 下 来 ， 我 们 用 (void(*)0)0 来 蔡 换 fp: 

(*(void(*)0)0)0; 

结尾 处 的 分 号 用 于 将 这 个 表达 式 转换 为 一 个 语句 。 


在 这 里 ， 我 们 解决 这 个 问题 时 没有 使 用 typedef 声 明 。 通 过 使 用 它 ， 我 们 
可 以 更 清晰 地 解决 这 个 问题 : 


typedef void (*funcptr)(); 
CduncptD0)0; 

2.2 运算 符 并 不 总 是 具有 你 所 想象 的 优先 级 
假设 有 一 个 声明 了 的 常量 FLAG， 它 是 一 个 整数 ， 其 二 进 制 表示 中 的 某 


一 位 被 置 位 〈 换 句 话 说 ， 它 是 2 的 茶 次 早 ) ， 并 且 你 希望 测试 一 个 整 型 
变量 flags 该 位 是 否 被 置 位 。 通 常 的 写法 是 : 


if(flags & FLAG)... 


其 意义 对 于 很 多 C 程 序 员 都 是 很 明确 的 :让 语句 测试 括号 中 的 表达 式 求 
值 的 结果 是 人 否 为 0。 出 于 清晰 的 目的 我 们 可 以 将 它 写 得 更 明确 : 


if(flags & FLAG != 0) … 


这 个 语句 现在 更 容易 理解 了 。 但 它 仍 然 是 错 的 ， 因 为 != 比 & 绑 定 得 更 紧 
密 ， 因 此 它 被 分 析 为 : 


if(flags & (FLAG != 0)) ... 


这 【偶尔 ) 是 可 以 的 ， 如 FLAG 是 1 或 0 (! ) 的 时 候 ， 但 对 于 其 他 2 的 过 
是 不 行 的 [2]。 


假设 你 有 两 个 整 型 变量 ，h 和 ]， 它 们 的 值 在 0 和 15〈 含 0 和 15) 之 间 ， 并 
且 你 希望 将 r 设 置 为 8 位 值 ， 其 低位 为 ]， 高 位 为 hn。 一 种 自然 的 写法 是 : 


r=h<<4+1; 


不 笠 的 是 ， 这 是 错误 的 。 加 法 比 移 位 绑 定 得 更 紧密 ， 因 此 这 个 例子 等 价 
于 : 


r=h<<(4+1); 
正确 的 方法 有 两 种 : 


r=(h<<4)+l]; 


r=h<<4|1 


避免 这 种 问题 的 一 个 方法 是 将 所 有 的 东西 都 用 括号 括 起 来 ， 但 表达 式 中 
的 括号 过 度 就 会 难以 理解 ， 因 此 最 好 还 是 是 记 住 C 中 的 优先 级 。 


不 羊 的 是 ， 这 有 15 个 ， 太 困难 了 。 然 而， 通过 将 它们 分 组 可 以 变 得 容 
易 。 


绑 定 得 最 紧密 的 运算 符 并 不 是 真正 的 运算 符 : 下 标 、 函 数 调 用 和 结构 选 
择 。 这 些 都 与 左边 相关 联 。 


接 下 来 是 一 元 运算 符 。 它 们 具有 真正 的 运算 符 中 的 最 高 优先 级 。 由 于 函 
数 调用 比 一 元 运算 符 绑 定 得 更 紧密 ， 你 必须 写 (*p)0 来 调用 p 指 回 的 函 
数 ; *p(0 表 示 p 是 一 个 返回 一 个 指针 的 函数 。 转 换 是 一 元 运算 符 ， 并 且 和 
其 他 一 元 运算 符 具 有 相同 的 优先 级 。 一 元 运算 符 是 右 结合 的 ， 因 此 
*p++ 表 示 *(p++)， 而 不 是 (*p)++。 


在 接 下 来 是 真正 的 二 元 运算 符 。 其 中 数学 运算 符 具 有 最 高 的 优先 级 ， 然 
后 是 移 位 运算 符 、 关 系 运 算 符 、 逻 辑 运 算 符 、 赋 值 运算 符 ， 最 后 是 条 件 
运算 符 。 需 要 记 住 的 两 个 重要 的 东西 是 : 

所 有 的 逻辑 运算 符 有 具有 比 所 有 关系 运算 符 都 低 的 优先 级 。 

移 位 运算 符 比 关系 运算 符 绑 定 得 更 紧密 ， 但 又 不 如 数学 运算 符 。 

在 这 些 运算 符 类 别 中 ， 有 一 些 奇 怪 的 地 方 。 乘 法 、 除 法 和 求 余 具 有 相同 
的 优先 级 ， 加 法 和 减法 具有 相同 的 优先 级 ， 以 及 移 位 运算 符 具 有 相同 的 
优先 级 。 

还 有 束 是 六 个 关系 运算 符 并 不 具有 相同 的 优先 级 : == 和 != 的 优先 级 比 其 
他 关系 运算 符 要 低 。 这 就 允许 我 们 判断 a 和 b 是 否 具有 与 c 和 d 相 同 的 顺 
序 ， 例 如 : 

a<b==c<d 

在 逻辑 运算 符 中 ， 没 有 任何 两 个 具有 相同 的 优先 级 。 按 位 运算 符 比 所 有 
顺序 运算 符 绑 定 得 都 紧密 ， 每 种 与 运算 符 都 比 相应 的 或 运算 符 绑 定 得 更 
紧密 ， 并 且 按 位 异 或 〈^A) 运算 符 介 于 按 位 与 和 按 位 或 之 间 。 

三 元 运算 符 的 优先 级 比 我 们 提 到 过 的 所 有 运算 符 的 优先 级 都 低 。 这 可 以 
保证 选择 表达 式 中 包含 的 关系 运算 符 的 逻辑 组 合 特性 ， 如 ; 


z=a<b&&b<c?d:e 
这 个 例子 还 说 明了 赋值 运算 符 具 有 比 条 件 运算 符 更 低 的 优先 级 是 有 意义 


的 。 男 外 ， 所 有 的 复合 赋值 运算 符 具 有 相同 的 优先 级 并 且 是 自 右 至 左 结 
合 的 ， 因 此 


a=b=c 


和 
b=c:a=b; 
是 等 价 的 。 


具有 了 最 低 优 先 级 的 是 喜 号 运算 待 。 这 很 容易 理解 ， 因 为 逗号 通常 在 需要 
表达 式 而 不 是 语句 的 时 候 用 来 将 代 分 号 。 


赋值 是 男 一 种 运算 符 ， 通 第 具有 混合 的 优先 级 。 例 如 ， 考 虑 下 面 这 个 用 
于 复制 文件 的 循环 : 


while(c = getc(in) != EOF) 


putc(c, out); 

这 个 while 循 环 中 的 表达 式 看 起 来 像 是 c 被 赋 以 getc(in) 的 值 ， 接 下 来 判断 
是 否 等 于 EOF 以 结束 循环 。 不 笠 的 是 ， 赋 值 的 优先 级 比 任何 比较 操作 都 
低 ， 因 此 c 的 值 将 会 是 getc(in) 和 EOF 比 较 的 结果 ， 并 且 会 被 抛弃 。 
此 , “复制” 得 到 的 文件 将 是 一 个 由 值 为 1 的 字 节 流 组 成 的 文件 。 


上 面 这 个 例子 正确 的 写法 并 不 难 : 


while((c = getc(in)) != EOF) 


putc(c, out); 


然而 ， 这 种 错误 在 很 多 复杂 的 表达 式 中 却 很 难 被 发 现 。 例 如 ， 随 UNIX 
系统 一 同 发 布 的 lint 程 序 通 常 带 有 下 面 的 错误 行 : 


if (((t = BTYPE(pt1->aty) == STRTY) ||t == UNIONTY) { 


这 条 语句 希望 给 t 赋 一 个 值 ， 然 后 看 t 是 否 与 STRTY 或 UNIONTY 相 等 。 
而 实际 的 效果 却 大 不 相同 [3]。 


C 中 的 逻辑 运算 符 的 优先 级 具有 历史 原因 。B 语 言 一 一 C 的 前 非 一 一 具有 
和 C 中 的 & 和 | 运算 符 对 应 的 逻辑 运算 符 。 尽 管 它们 的 定义 是 按 位 的 ， 但 
编译 堪 在 条 件 判 断 上 下 文中 将 它们 视 为 和 长 & 和 | 一 样 。 当 在 C 中 将 它们 
分 开 后 ， 优 先 级 的 改变 是 很 危险 的 [4]。 


2.3 看 看 这 些 分 号 ! 


C 中 的 一 个 多 余 的 分 号 通常 会 带 来 一 点 点 不 同 ， 或 者 是 一 个 空 语句 ， 无 
任何 效果 ， 或 者 编译 器 可 能 提出 一 个 诊断 消息 ， 可 以 方便 除去 掉 它 。 一 
个 重要 的 区 别 是 在 必须 跟 有 一 个 语句 的 f 和 while 语 名 中 。 考 虑 下 面 的 例 
子 : 


if(x > big); 

big = x; 

这 不 会 发 生 编译 错误 ， 但 这 上段 程序 的 意义 与 : 
这 x > big) 

big = x; 

就 大 不 相同 了 。 第 一 个 程序 段 等 价 于 : 

if(x > pig) 1 } 


big = x; 
(除非 x、i 或 big 是 带 有 副作用 的 宏 〉。 


为 一 个 因 分 写 引 起 巨大 不 同 的 地 方 是 函数 定义 前 面 的 结构 声明 的 末尾 
([ 译 注 ] 这 人 句 话 不 太 好 听 ， 看 例子 束 明 白 了 〉 。 考 虑 下 面 的 程序 片段 : 


struct foo { 
int x; 

} 

1Of 


在 紧 换 着 /的 第 一 个 }) 后 面 丢 失 了 一 个 分 号 。 它 的 效果 是 声明 了 一 个 函数 
六 返回 值 类 型 是 struct foo， 这 个 结构 成 了 函数 声明 的 一 部 分 。 如 果 这 里 
出 现 了 分 号 ， 则 /将 被 定义 为 具有 默认 的 整 型 返回 值 厂 ) 。 

2.4 switch 语 名 


通常 C 中 的 switch 语 句 中 的 case 段 可 以 进入 下 一 个 。 例 如 ， 考 目下 面 的 C 
和 Pascal 程 序 片断 : 


switch(color) { 

case 1: printf ("red"); 
break; 

case 2: printf ("yellow"); 
break; 

case 3: printf ("blue"); 
break; 

} 

case color of 

1: write (red'); 

2: Write (‘yellow'); 

3: write (blue'); 


end 


这 两 个 程序 片段 都 作 相 同 的 事情 : 根据 变量 color 的 值 是 1、2 还 是 3 打印 
red、yellow 或 blue 〈 没 有 新 行 符 ) 。 这 两 个 程序 片段 非常 相似 ， 只 有 一 
点 不 同 : Pascal 程 序 中 没有 C 中 相应 的 break 语 句 。C 中 的 case 标 签 是 真正 
的 标签 : 控制 流程 可 以 无 限制 地 进入 到 一 个 case 标 签 中 。 


看 看 另 一 种 形式 ， 假 设 C 程 序 段 看 起 来 更 像 Pascal: 


Switch(color) { 

case 1: printf ("red"); 
case 2: printf ("yellow"); 
case 3: printf ("blue"); 

} 


并 且 假 设 color 的 值 是 2。 则 该 程序 将 打印 yellowblue， 因 为 控制 自然 地 转 
入 到 下 一 个 printfO 的 调用 。 


这 既是 C 语 言 switch 语 句 的 优点 又 是 它 的 弱点 。 说 它 是 弱点 ， 是 因为 很 
容易 在 记 一 个 break 语 句 ， 从 而 导致 程序 出 现 隐 有 睡 的 异常 行为 。 说 它 是 
优点 ， 是 因为 通过 故意 去 掉 break 语 句 ， 可 以 很 容易 实现 其 他 方法 难以 
实现 的 控制 结构 。 尤 其 是 在 一 个 大 型 的 switch 语 名 中， 我 们 经 常 发 现 对 
一 个 case 的 处 理 可 以 简化 其 他 一 些 特 殊 的 处 理 。 


例如 ， 设 想 有 一 个 程序 是 一 台 假 想 的 机 峰 的 翻译 器 。 这 样 的 一 个 程序 可 
能 包含 一 个 switch 语 句 来 处 理 各 种 操作 码 。 在 这 样 一 台 机 器 上 ， 通 第 减 
法 在 对 其 第 二 个 运算 数 进 行 变 号 后 束 变 成 和 加 法 一 样 了 。 因 此 ， 最 好 可 
以 写 出 这 样 的 语句 : 


case SUBTRACT: 


opnd2 = -opnd2; 
/* no break; */ 


case ADD: 


另外 一 个 例子 ， 考 虑 编译 吉 通 过 跳 过 空白 字符 来 查找 一 个 记号 。 这 里 ， 
我 们 将 空格 、 制 表 符 和 新 行 符 视 为 是 相同 的 ， 除 了 新 行 符 还 要 引起 行 计 
数 器 的 增长 外 : 


case \n': 
linecount++; 
/* no break */ 
case \t' 


Case '': 


2.5 函数 调用 


和 其 他 程序 设计 语言 人 不同，C 要 求 一 个 函数 调用 必须 有 一 个 参数 列表 ， 
但 可 以 没有 参数 。 因 此 ， 如 果 f 是 一 个 函数 ， 


f0; 

就 是 对 该 函数 进行 调用 的 语句 ， 而 

f; 

什么 也 不 做 。 它 会 作为 函数 地 址 被 求 值 ， 但 不 会 调用 它 [6]。 
2.6 悬挂 else 问 题 


在 讨论 任何 语法 缺陷 时 我 们 都 不 会 忘记 提 到 这 个 问题 。 尽 管 这 一 问题 不 
是 C 语 言 所 独 有 的 ， 但 它 仍然 伤害 着 那些 有 着 多 年 经 验 的 C 程 序 员 。 


考虑 下 面 的 程序 片断 : 
if(x == 0) 


if(y == 0) error(); 

else { 

2 二 

f(&z); 

} 

写 这 段 程序 的 程序 员 的 目的 明显 是 将 情况 分 为 两 种 : x = 0 和 x != 0。 在 
第 一 种 情况 中 ， 程 序 段 什 么 都 不 做 ， 除 非 y = 0 时 调用 error0)。 第 二 种 情 
况 中 ， 程 序 设置 z = x+y 并 以 z 的 地 址 作为 参数 调用 f()。 

然而 ， 这 段 程序 的 实际 效果 却 大 为 不 同 。 其 原因 是 一 个 else 总 是 与 其 最 
近 的 证 相关 联 。 如 果 我 们 希望 这 段 程序 能 够 按照 实际 的 情况 运行 ， 应 该 
这 样 写 : 

if(x == 0) { 


error(); 
else { 
Zz=X+y; 
f(&z); 

} 

} 


换 句 话说 ， 当 x ”!= ”0 发 生 时 什么 也 不 做 。 如 果 要 达到 第 一 个 例子 的 效 
果 ， 应 该 写 : 


if(x == 0) { 


if(y ==0) 


error(); 


3 连接 
一 个 C 程 序 可 能 有 很 多 部 分 组 成 ， 它 们 被 分 别 编译 ， 并 由 一 个 通常 称 为 
连接 器 、 连 接 编 辑 器 或 加 载 器 的 程序 绑 定 到 一 起 。 由 于 编译 器 一 次 通常 
只 能 看 到 一 个 文件 ， 因 此 它 无 法 检测 到 需要 程序 的 多 个 源 文 件 的 内 容 才 
能 发 现 的 错误 。 


在 这 一 节 中 ， 我 们 将 看 到 一 些 这 种 类 型 的 错误 。 有 一 些 C 实 现 ， 但 不 是 
所 有 的 ， 带 有 一 个 称 为 lint 的 程序 来 捕获 这 些 错误 。 如 果 具 有 一 个 这 样 
的 程序 ， 那 么 无 论 怎样 地 强调 它 的 重要 性 都 不 过 分 。 

3.1 你 必须 自己 检查 外 部 类 型 


假设 你 有 一 个 C 程 序 ， 被 划分 为 两 个 文件 。 其 中 一 个 包含 如 下 声明 : 


int Di; 
而 令 一 个 包含 如 下 声明 : 
long n; 


这 不 是 一 个 有 效 的 C 程 序 ， 因 为 一 些 外 部 名 称 在 两 个 文件 中 被 声明 为 不 
同 的 类 型 。 然 而 ， 很 多 实现 检测 不 到 这 个 错误 ， 因 为 编译 器 在 编译 其 中 
一 个 文件 时 并 不 知道 另 一 个 文件 的 内 容 。 因 此 ， 检 查 类 型 的 工作 只 能 由 
连接 器 (或 一 些 工具 程序 如 lint) 来 完成 ， 如 果 操作 系统 的 连接 器 不 能 


识别 数据 类 型 ，C 编 译 融 也 没 法 过 多 地 强制 它 。 
那么 ， 这 个 程序 运行 时 实际 会 及 生 什么 ?这 有 很 多 可 能 性 : 


实现 足够 乳 明 ， 能 够 检测 到 类 型 冲突 。 则 我 们 会 得 到 一 个 诊断 消 有 息 ， 说 
明 n 在 两 个 文件 中 具有 不 同 的 类 型 。 


你 所 使 用 的 实现 将 int 和 1long 视 为 相同 的 类 型 。 典 型 的 情况 是 机 器 可 以 目 
然 地 进行 32 位 运算 。 在 这 种 情况 下 你 的 程序 或 许 能 够 工作 ， 好 象 你 两 次 
都 将 变量 声明 为 long 〈 或 int) 。 但 这 种 程序 的 工作 纯 属 偶然 。 


n 的 两 个 实例 需要 不 同 的 存储 ， 它 们 以 茶 种 方式 共享 存储 区 ， 即 对 其 中 
一 个 的 赋值 对 男 一 个 也 有 效 。 这 可 能 发 生 ， 例 如 ， 编 译 占 可 以 将 int 安 排 
dy 
同样 是 偶然 。 


n 的 两 个 实例 以 男 一 种 方式 共 至 存储 区 ， 即 对 其 中 一 个 赋值 的 效果 是 对 
另 一 个 赋 以 不 同 的 值 。 在 这 种 情况 下 ， 程 序 可 能 失败 。 


这 种 情况 发 生 的 里 一 个 例子 出 奇 地 频繁 。 程 序 的 某 一 个 文件 包含 下 面 的 


声明 


char filename[|] = "etc/passwd"; 

而 男 一 个 文件 包含 这 样 的 声明 : 

char *filename; 

尽管 在 某 些 环境 中 数组 和 指针 的 行为 非常 相似 ， 但 它们 是 不 同 的 。 在 第 
一 个 声明 中 ，filename 是 一 个 字符 数组 的 名 字 。 尺 管 使 用 数组 的 名 字 可 
以 产生 数组 第 一 个 元 素 的 指针 ， 但 这 个 指针 只 有 在 需要 的 时 候 才 产生 并 
且 不 会 持续 。 在 第 二 个 声明 中 ，filename 是 一 个 指针 的 名 字 。 这 个 指针 
可 以 指 同 程序 员 让 它 指向 的 任何 地 方 。 如 果 程 序 员 没有 给 它 赋 一 个 值 ， 
它 将 具有 一 个 默认 的 0 值 (NULL) 〈[ 译 注 ] 实 际 上 ， 在 C 中 一 个 为 初始 
化 的 指针 通常 具有 一 个 随机 的 值 ， 这 是 很 危险 的 ! ) 。 

这 两 个 声明 以 不 同 的 方式 使 用 存储 区 ， 它 们 不 可 能 共存 。 


避免 这 种 类 型 冲突 的 一 个 方法 是 使 用 像 lint 这 样 的 工具 《如果 可 以 的 


话 ) 。 为 了 在 一 个 程序 的 不 同 编译 单元 之 间 检 查 类 型 冲突 ， 一 些 程序 需 
要 一 次 看 到 其 所 有 部 分 。— 典 型 的 编译 器 无 法 完成 ， 但 lint 可 以 。 
避免 该 问题 的 另 一 种 方法 是 将 外 部 声明 放 到 包含 文件 中 。 这 时 ， 一 个 外 
部 对 象 的 类 型 仅 出 现 一 次 [7 了 ]。 

4 语义 缺陷 
一 个 句子 可 以 是 精确 拼写 的 并 且 没 有 语法 错误 ， 但 仍然 没有 意义 。 在 这 
一 节 中 ， 我 们 将 会 看 到 一 些 程序 的 写法 会 使 得 它们 看 起 来 是 一 个 意思 ， 
但 实际 上 是 另 一 种 完全 不 同 的 意思 。 
我 们 还 要 讨论 一 些 表 面 上 看 起 来 合理 但 实际 上 会 产生 未 定义 结果 的 环 
境 。 我 们 这 里 讨论 的 东西 并 不 保证 能 够 在 所 有 的 C 实 现 中 工作 。 我 们 暂 
且 筷 记 这 些 能 够 在 一 些 实现 中 工作 但 可 能 不 能 在 另 一 些 实现 中 工作 的 东 
西 ， 直 到 第 7 节 讨 论 可 以 执行 问题 为 止 。 


4.1 表达 式 求 值 顺序 


一 些 C 运 算 符 以 一 种 已 知 的 、 特 定 的 顺序 对 其 操作 数 进行 求 值 。 但 另 一 
些 不 能 。 例 如 ， 考 虑 下 面 的 表达 式 : 


a<b&&c<d 


C 语 言 定 义 规定 a < b 首 先 被 求 值 。 如 有 果 a 确 实 小 于 b，c < d 必 须 紧 接着 被 
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要 对 a < b 求 值 ， 编 译 占 对 a 和 b 的 求 值 束 会 有 一 个 先后 。 但 在 一 些 机 器 
上 ， 它 们 也 许 是 并 行进 行 的 。 


C 中 只 有 四 个 运算 符 &&、|、?: 和 ,指定 了 求 值 顺序 。&& 和 || 最 先 对 左边 
的 操作 数 进行 求 值 ， 而 右边 的 操作 数 只 有 在 需要 的 时 候 才 进行 求 值 。 

而 ?: 运 算 符 中 的 三 个 操作 数 : a、b 和 c， 最 先 对 a 进 行 求 值 ， 之 后 仅 对 b 或 
c 中 的 一 个 进行 求 值 ， 这 取决 于 a 的 值 。, 运 算 符 首 先 对 左边 的 操作 数 进行 
求 值 ， 然 后 抛弃 它 的 值 ， 对 右边 的 操作 数 进行 求 值 [8]。 


C 中 所 有 其 它 的 运算 答对 操作 数 的 求 值 顺 序 都 是 未 定义 的 。 事 实 上 ， 赋 


值 运 算 符 不 对 求 值 顺序 做 出 任何 保证 。 


出 于 这 个 原因 ， 下 面 这 种 将 数组 x 中 的 前 n 个 元 素 复制 到 数组 y 中 的 方法 
古 不 可 行 的 : 


i=0; 

while(i < n) 

y= xlit+]; 

其 中 的 问题 是 y 的 地 址 并 不 保证 在 i 增长 之 前 被 求 值 。 在 某 些 实现 中 ， 这 
Os 


i = 0; 


while(i < n) 

ylit++] = x; 

而 下 面 的 代码 是 可 以 工作 的 : 
i= 0; 


while(i <n)f{ 


当然 ， 这 可 以 简写 为 : 
forGi = 0; i <n; i++) 


》 X, 


4.2 &&、|| 和 ! 运 算 符 


C 中 有 两 种 逻辑 运算 符 ， 在 菜 些 情况 下 是 可 以 交换 的 ， 按 位 运算 符 &、| 
和 ~， 以 及 逻辑 运算 符 &&、|| 和 !。 一 个 程序 员 如 果 用 某 一 类 运算 符 替 换 
相应 的 另 一 类 运算 符 会 得 到 某 些 奇怪 的 效果 程序 可 能 会 正确 地 工作 ， 
但 这 纯 属 偶然 。 


&&、|| 和 ! 运 算 符 将 它们 的 参数 视 为 仅 有 “ 真 ?或 * 假 ”， 通 常 约定 0 代 

表 “ 假 "而 其 它 的 任意 值 都 代表 “ 真 ”。 这 些 运算 符 返 回 1 表 示 “ 真 ”而 返回 0 
表示 “ 假 ?”， 而 且 && 和 | 运算 符 当 可 以 通过 左边 的 操作 数 确 定 其 返回 值 
时 ， 就 不 会 对 右边 的 操作 数 进 行 求 值 。 


因此 !10 是 零 ， 因 为 10 非 零 ， 10 && 12 是 1， 因 为 10 和 12 都 非 零 ，10 || 12 
也 是 1， 因 为 10 非 零 。 男 外 ， 最 后 一 个 表达 式 中 的 12 不 会 被 求 值 ，10 | 
f() 中 的 f0 也 不 会 被 求 值 。 

考虑 下 面 这 段 用 于 在 一 个 表 中 查找 一 个 特定 元 素 的 程序 : 


i= 0; 


while(i < tabsize && tab /= x) 
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这 段 循环 背后 的 意思 是 如 果 ;i 等 于 tabsize 时 循环 结束 ， 元 素 未 被 找到 。 人 否 
则 ,i 包含 了 元 素 的 索引 。 


假设 这 个 例子 中 的 && 不 小 心 被 薄 换 为 了 &， 这 个 循环 可 能 仍然 能 够 工 
作 ， 但 只 有 两 种 羊 运 的 情况 可 以 使 它 俘 下 来 。 


首先 ， 这 两 个 操作 都 是 当 条 件 为 假 时 返回 0， 当 条 件 为 真 时 返回 1。 只 要 
x 和 y 都 是 1 或 0，x & y 和 x && y 部 具有 相同 的 值 。 然 而 ， 如 果 当 使 用 了 除 
人 了 这 两 个 运算 符 ， 这 个 循环 将 不 会 工 


其 次 ， 由 于 数组 元 素 不 会 改变 ， 因 此 越过 数组 最 后 一 个 元 素 前 进 一 个 位 
置 时 是 无 害 的 ， 循 环 会 季 运 地 停 下 来 。 失 误 的 程序 会 越过 数组 的 结尾 ， 
因为 & 不 像 &&， 总 是 会 对 所 有 的 操作 数 进 行 求 值 。 因 此 循环 的 最 后 一 
次 获取 tab 时 i 的 值 已 经 等 于 tabsize 了 。 如 果 tabsize 是 tab 中 元 素 的 数量 ， 


则 会 取 到 tab 中 不 存在 的 一 个 值 。 
4.3 下 标 从 零 开 始 


在 很 多 语言 中 ， 上 共有 n 个 元 际 的 数组 其 元 素 的 号 码 和 它 的 下 标 是 从 1 到 nm 
严格 对 应 的 。 但 在 C 中 不 是 这 样 。 


一 个 具有 n 个 元 素 的 C 数 组 中 没有 下 标 为 n 的 元 素 ， 其 中 的 元 素 的 下 标 是 
从 0 到 n - 1。 因 此 从 其 它 语言 转 到 C 语 言 的 程序 员 应 该 特别 小 心地 使 用 数 
组 : 


int i, al10]; 
for(i = 1; i <= 10; i++) 
a=0; 
这 个 例子 的 目的 是 要 将 a 中 的 每 个 元 素 都 设置 为 0， 但 没有 期 望 的 效果 。 
因为 for 语 句 中 的 比较 i < 10 被 蕉 换 成 了 i <= 10，a 中 的 一 个 编写 为 10 的 
并 不 存在 的 元 素 被 设置 为 了 0， 这 样 内 存 中 a 后 面 的 一 个 字 被 破坏 了 。 如 
果 编 译 该 程序 的 编译 器 按照 降序 地 址 为 用 户 变 量 分 配 内 存 ， 则 a 后 面 就 
是 i。 将 i 设置 为 零 会 导致 该 循环 陷入 一 个 无 限 循环 。 

4.4 C 并 不 总 是 转换 实 参 


下 面 的 程序 段 由 于 两 个 原因 会 失败 : 


double s; 
s = sqgrt(2); 
printf("%g\n", s); 


第 一 个 原因 是 sqrtO0 需 要 一 个 double 值 作为 它 的 参数 ， 但 没有 得 到 。 第 二 
个 原因 是 它 返 回 一 个 double 值 但 没有 这 样 声名 。 改 正 的 方法 只 有 一 个 : 


double s, sqrt(); 


Ss = sqgrt(2.0); 


printf("%g\n", s); 


C 中 有 两 个 简单 的 规则 控制 着 函数 参数 的 转换 ，(1) 比 int 短 的 整 型 被 转换 
为 int; (2) 比 double 短 的 浮 点 类 型 被 转换 为 double。 所 有 的 其 它 值 不 被 转 
换 。 确 保函 数 参数 类 型 的 正确 性 是 程序 员 的 责任 。 


因此 ， 一 个 程序 员 如 果 想 使 用 如 sgrt() 这 样 接 受 一 个 double 类 型 参数 的 函 
数 ， 就 必须 仅 传递 给 它 float 或 double 类 型 的 参数 。 常 数 2 是 一 个 int， 因 此 
其 类 型 是 错误 的 。 


当 一 个 函数 的 值 被 用 在 表达 式 中 时 ， 其 值 会 被 自动 地 转换 为 适当 的 类 

型 。 然 而 ， 为 了 完成 这 个 自动 转换 ， 编 译 紫 必须 知道 该 函数 实际 返回 的 
类 型 。 没 有 更 进一步 声名 的 函数 被 假设 返回 int， 因 此 声名 这 样 的 函数 并 
0 


实际 上 ，C 实 现 通常 多 许 一 个 文件 包含 include 语 句 来 包含 如 sqrt0 这 些 库 
函数 的 声名 ， 但 是 对 那些 自己 写 函 数 的 程序 员 来 说 ， 编 写 声名 也 是 必要 


的 一 一 或 者 说 ， 对 那些 编写 非凡 的 C 程 序 的 人 来 说 是 有 必要 的 。 
这 里 有 一 个 更 加 壮观 的 例子 : 

main() { 

int i; 

char c; 


for(i = 0;i< 5; i++) { 
scanf("%d", &c); 
printf("%d", i); 

} 

printf("\n"); 


} 


表面 上 看 ， 这 个 程序 从 标准 输入 中 读 取 五 个 整数 并 向 标准 输出 写 入 0 1 2 
3 4。 实 际 上 ， 它 并 不 总 是 这 么 做 。 璧 如 在 一 些 编译 器 中 ， 它 的 输出 为 0 
00001234。 


为 什么 ”因为 c 的 声名 是 char 而 不 是 int。 当 你 令 scanf() 去 读 取 一 个 整数 
时 ， 它 需要 一 个 指 问 一 个 整数 的 指针 。 但 这 里 它 得 到 的 是 一 个 字符 的 指 
针 。 但 scanfO 并 不 知道 它 没 有 得 到 它 所 需要 的 : 它 将 输入 看 作 是 一 个 指 
问 整 数 的 指针 并 将 一 个 整数 存 迪 到 那里 。 由 于 整数 占用 比 字符 更 多 的 内 
存 ， 这 样 做 会 影响 到 c 附 近 的 内 存 。 


c 附 近 确 切 是 什么 是 编译 器 的 事 ， 在 这 种 情况 下 这 有 可 能 是 i 的 低位 。 
此 ， 每 当 向 c 中 读 入 一 个 值 ，i 束 被 置 零 。 当 程序 最 后 到 达 文 件 结尾 时 ， 
scanf(0) 不 再 尝试 同 c 中 放 入 新 值 ， 计 可 以 正常 地 增长 ， 直 到 循环 结束 。 


4.5 指针 不 是 数组 


C 程 序 通 常 将 一 个 字符 串 转 换 为 一 个 以 空 字符 结尾 的 字符 数组 。 假 设 我 
们 有 两 个 这 样 的 字符 串 s 和 t， 并 且 我 们 想 要 将 它们 连接 为 一 个 单独 的 字 
符 串 r。 我 们 通常 使 用 库 函 数 strcpy0 和 strcat(0) 来 完成 。 下 面 这 种 明显 的 
方法 并 不 会 工作 : 


char *r; 
Strcpy(r, S); 
Strcat(T, ); 


这 是 因为 r 没 有 被 初始 化 为 指 同 任 何 地 方 。 尽 管 r 可 能 潜在 地 表示 某 一 块 
内 存 ， 但 这 并 不 存在 ， 直 到 你 分 配 它 。 


让 我 们 再 试 试 ， 为 r 分 配 一 些 内 存 : 
char r[100]; 

strepy(r, S); 

strcat(r, t; 


这 只 有 在 s 和 {t 所 指 同 的 字符 串 不 很 大 的 时 候 才 能 够 工作 。 不 蔷 的 是 ，C 


要 求 我 们 为 数组 指定 的 大 小 是 一 个 和 营 数 ， 因 此 无 法 确定 zx 是否 足够 大 。 
然而 ， 很 多 C 实 现 带 有 一 个 叫做 malloc0 的 库 函 数 ， 它 接受 一 个 数字 并 分 
配 这 么 多 的 内 存 。 通 党 还 有 一 个 函数 称 为 strlen()， 可 以 告诉 我 们 一 个 字 
符 串 中 有 多 少 个 字符 ， 因 此 ， 我 们 可 以 写 : 


char *r, *malloc(); 


r= malloc(strlen(s) + strlen(t)); 


strcpy(Y, s); 
strcat(r, ); 


然而 这 个 例子 会 因为 两 个 原因 而 失败 。 首 先 ，mallocO 可 能 会 耗 尽 内 
存 ， 而 这 个 事件 仅 通 过 静 静 地 返回 一 个 空 指针 来 表示 。 


其 次 ， 更 重要 的 是 ，malloc() 并 没有 分 配 足 够 的 内 存 。 一 个 字符 串 是 以 
一 个 空 字 符 结束 的 。 而 strlen0) 函 数 返 回 其 字符 串 参 数 中 所 包含 字符 的 数 
量 ， 但 不 包括 结尾 的 空 字符 。 因 此 ， 如 果 strlen(s) 是 n， 则 s 需 要 n + 1 个 
字符 来 盛 放 它 。 因 此 我 们 需要 为 r 分 配额 外 的 一 个 字符 。 再 加 上 检查 
mallocO 是 否 成 功 ， 我 们 得 到 : 


char *r, *malloc(); 

r= malloc(strlen(s) + strlen(t) + 1); 
if(!r) { 

complain(); 

exit(1); 

} 

strcpy(r, s); 

strcat(r, ); 


4.6 避免 提 喻 法 


提 喻 法 (Synecdoche， sin-ECK-duh-key) 是 一 种 文学 手法 ， 有 点 类 似 于 
明 喻 或 暗喻 ， 在 牛津 英文 词典 中 解释 如 下 : “a more comprehensive term 
is used for a less comprehensive or vice versa; as whole for part or part for 
whole, genus for species or species for genus, etc. (将 全 面 的 单位 用 作 不 全 
面 的 单位 ， 或 反之 ; 如 整体 对 局 部 或 局 部 对 整体 、 一 般 对 特殊 或 特殊 对 


一 般 ， 等 等 。) ” 


这 可 以 精确 地 描述 C 中 通常 将 指针 误 以 为 是 其 指向 的 数据 的 错误 。 正 将 
常会 在 字符 串 中 发 生 。 例 如 : 


char *p, *q; 
p= XyYZ ; 
尽管 认为 p 的 值 是 xyz 有 时 是 有 用 的 ， 但 这 并 不 是 真 的 ， 理 解 这 一 点 非常 


重要 。p 的 值 是 指向 一 个 有 四 个 字符 的 数组 中 第 0 个 元 素 的 指针 ， 这 四 个 
字符 是 xX、y、2 和 \0'。 因 此 ， 如 果 我 们 现在 执行 : 


d=P; 


pP 和 gq 会 指 问 同 一 块 内 存 。 内 存 中 的 字符 没有 因为 赋值 而 被 复制 。 这 种 情 
况 看 起 来 是 这 样 的 : 


要 记 住 的 是 ， 复 制 一 个 指针 并 不 能 复制 它 所 指向 的 东西 。 

因此 ， 如 果 之 后 我 们 执行 : 

qd[1] = 'Y 

dq 所 指向 的 内 存 包 含 字 符 串 xYz。p 也 是 ， 因 为 p 和 qd 指 向 相同 的 内 存 。 
4.7 空 指针 不 是 空 字符 串 

将 一 个 整数 转换 为 一 个 指针 的 结果 是 实现 相关 的 (implementation- 

dependent) ， 除 了 一 个 例外 。 这 个 例外 是 常数 0， 它 可 以 保证 被 转换 为 

一 个 与 其 它 任 何 有 效 指针 都 不 相等 的 指针 。 这 个 值 通常 类 似 这 样 定 义 : 


#define NULL 0 


但 其 效果 是 相同 的 。 要 记 住 的 一 个 重要 的 事情 是 ， 当 用 0 作为 指针 时 它 
决 不 能 被 解除 引用 。 换 句 话说 ， 当 你 将 0 赋 给 一 个 指针 变量 后 ， 你 就 不 
能 访问 它 所 指 问 的 内 存 。 不 能 这 样 写 : 

if(p == (char *)0)... 

也 不 能 这 样 写 : 

if(stremp(p, (char *)0) == 0)... 

因为 stremp0 总 是 通过 其 参数 来 查看 内 存 地 址 的 。 

如 果 p 是 一 个 空 指针 ， 这 样 写 也 是 无 效 的 : 


printf(p); 
或 
printf("%s", p); 
4.8 整数 淤 出 
C 语 言 关于 整数 操作 的 上 溢 或 下 溢 定 义 得 非常 明确 。 


只 要 有 一 个 操作 数 是 无 符号 的 ， 结 果 就 是 无 符号 的 ， 并 且 以 2n 为 模 ， 其 
中 mn 为 字 长 。 如 果 两 个 操作 数 都 是 带 符 号 的 ， 则 结果 是 未 定义 的 。 


例如 ， 假 设 a 和 b 和 十 两 个 非 负 整 型 变量 ， 你 希望 测试 a + b 是 否 溢出 。 一 个 
明显 的 办 法 是 这 样 的 : 


if(a + b <0) 


complain(); 
通常 ， 这 是 不 会 工作 的 。 
一 旦 a + b 发 生 了 洲 出 ， 对 于 结果 的 任何 赌注 都 是 没有 意义 的 。 例 如 ， 在 


某 些 机 器 上 ， 一 个 加 法 运算 会 将 一 个 内 部 寄存 需 设 置 为 四 种 状态 : 正 、 
负 、 和 零 或 溢出 。 “在 这 样 的 机 器 上 ， 编 译 器 有 权 将 上 面 的 例子 实现 为 首 


先 将 a 和 b 加 在 一 起 ， 然 后 检查 内 部 寄存 右 状 态 古 否 为 负 。 如 果 该 运算 洲 
出 ， 内 部 寄存 器 将 处 于 洲 出 状态 ， 这 个 测试 会 失败 。 


使 这 个 特殊 的 测试 能 够 成 功 的 一 个 正确 的 方法 是 依赖 于 无 符号 算术 的 良 
好 定义 ， 即 要 在 有 符号 和 无 符号 之 间 进 行 转换 : 


if((int)((unsigned)a + (unsigned)b) < 0) 


complain(); 

4.9 移 位 运算 符 

两 个 原因 会 令 使 用 移 位 运算 符 的 人 感到 烦恼 : 

在 右 移 运 算 中 ， 空 出 的 位 是 用 0 填充 还 是 用 符号 位 填充 ? 

移 位 的 数量 允许 使 用 哪些 数 ? 

第 一 个 问题 的 答案 很 简单 ， 但 有 时 是 实现 相关 的 。 如 果 要 进行 移 位 的 操 
作 数 是 无 符号 的 ， 会 移入 0。 如 果 操 作 数 是 带 符 写 的 ， 则 实现 有 权 决 定 
是 移入 0 还 是 移入 符 写 位 。 如 果 在 一 个 右 移 操作 中 你 很 天 心 空位 ， 那 么 
用 unsigned 来 声明 变量 。 这 样 你 就 有 权 假 设 空位 被 设置 为 0。 

第 二 个 问题 的 答案 同样 简单 : 如 果 竺 移 位 的 数 长 度 为 n， 则 移 位 的 数量 
必须 大 于 等 于 0 并 且 严 格 地 小 于 n。 因 此 ， 在 一 次 单独 的 操作 中 不 可 能 将 
所 有 的 位 从 变量 中 移出 。 


例如 ， 如 果 一 个 int 是 32 位 ， 且 n 是 一 个 int， 写 n << 31 和 n << 0 是 合法 
的 ， 但 n << 32 和 n << -1 是 不 合法 的 。 


注意 ， 即 使 实现 将 符号 为 移入 空位 ， 对 一 个 带 符号 整数 的 右 移 运算 和 除 
以 2 的 某 次 肾 也 不 是 等 价 的 。 为 了 证 明 这 一 点 ， 考 虑 (-1) >> 1 的 值 ， 这 是 
不 可 能 为 0 的 。[ 译 注 : (-D /2 的 结果 是 0。] 


5 库 函 数 
每 个 有 用 的 C 程 序 都 会 用 到 库 函 数 ， 因 为 没有 办 法 把 输入 和 输出 内 建 到 


语言 中 去 。 在 这 一 市 中 ， 我 们 将 会 看 到 一 些 广 泛 使 用 的 库 函 数 在 茶 种 情 
况 下 会 出 现 的 一 些 非 预期 行为 。 


5.1 getc(O 返 回 整数 
考虑 下 面 的 程序 : 
#include 
main() { 
char c; 
while((c = getchar()) != EOF) 
ee 
} 


这 段 程序 看 起 来 好 像 要 将 标准 输入 复制 到 标准 输出 。 实 际 上 ， 它 并 不 完 
全 会 做 这 些 。 


原因 是 c 被 声明 为 字符 而 不 是 整数 。 这 意味 着 它 将 不 能 接收 可 能 出 现 的 
所 有 字符 包括 EOF。 

因此 这 里 有 两 种 可 能 性 。 有 时 一 些 合 法 的 输入 字符 会 导致 < 携带 和 EOF 
相同 的 值 ， 有 时 又 会 使 c 无 法 存放 EOF 值 。 在 前 一 种 情况 下 ， 程 序 会 在 
文件 的 中 间 停 止 复 制 。 在 后 一 种 情况 下 ， 程 序 会 陷入 一 个 无 限 循环 。 


实际 上 ， 还 存在 着 第 三 种 可 能 : 程序 会 偶然 地 正确 工作 。C 语 言 参考 手 
册 严 格 地 定义 了 表达 式 


((c = getchar()) != EOF) 
的 结果 。 其 6.1 节 中 声明 : 


当 一 个 较 长 的 整数 被 转换 为 一 个 较 短 的 整数 或 一 个 char 时 ， 它 会 被 截 去 
左 侧 ; 超出 的 位 被 简单 地 丢弃 。 


7.14 节 声明 : 


存在 着 很 多 赋值 运算 符 ， 它 们 都 是 从 右 至 左 结合 的 。 它 们 都 需要 一 个 左 


值 作为 左 侧 的 操作 数 ， 而 赋值 表达 式 的 类 型 就 是 其 左 侧 的 操作 数 的 类 
型 。 其 值 就 是 已 经 赋 过 值 的 左 操 作 数 的 值 。 


这 两 个 条 天 的 组 合 效 果 束 是 必须 通过 丢弃 getchar0 的 结果 的 高 位 ， 将 其 
截 短 为 字符 ， 之 后 这 个 被 截 短 的 值 再 与 EOF 进 行 比较 。 作 为 这 个 比较 的 
一 部 分 ，c 必 须 被 扩展 为 一 个 整数 ， 或 者 采取 将 左 侧 的 位 用 0 填充 ， 或 者 
适当 地 采取 符号 扩展 。 
然而 ， 一 些 编译 器 并 没有 正确 地 实现 这 个 表达 式 。 它 们 确实 将 getchar() 
的 值 的 低 几 位 赋 给 c。 但 在 c 和 EOF 的 比较 中 ， 它 们 却 使 用 了 getchar0 的 
值 ! 这 样 做 的 编译 器 会 使 这 个 事例 程序 看 起 来 能 够 “正确 地 ”工作 。 

5.2 绥 冲 输出 和 内 存 分 配 
当 一 个 程序 产生 输出 时 ， 能 够 立即 看 到 它 有 多 重要 ? 这 取决 于 程序 。 


例如 ， 终 端 上 显示 输出 并 要 求人 们 坐 在 终端 前 面 回答 一 个 问题 ， 人 们 能 
够 看 到 输出 以 知道 该 输入 什么 就 显得 至 关 重 要 了 。 为 一 方面 ， 如 果 输 出 
到 一 个 文件 中 ， 并 最 终 被 发 送 到 一 个 行 式 打印 机 ， 只 有 所 有 的 输出 最 终 
能 够 到 达 那 里 是 重要 的 。 

立即 安排 输出 的 显示 通常 比 将 其 暂时 保存 在 一 大 块 一 起 输出 要 郧 贵 得 

0 
[]。 


这 个 控制 通常 约定 为 一 个 称 为 setbuf0 的 库 函 数 。 如 果 buf 是 一 个 具有 适 
当 大 小 的 字符 数组 ， 则 


setbuf(stdout, buf); 
将 告诉 VO 库 写 入 到 stdout 中 的 输出 要 以 buf 作 为 一 个 输出 缓冲 ， 并 且 等 到 
buf 满 了 或 程序 员 直 接 调用 fflush() 再 实际 写 出 。 绥 冲 区 的 合适 的 大 小 在 
中 定义 为 BUFSIZ。 


TS 


#include 


main() { 

int c; 

char buf[BUFSIZ]; 

setbuf(stdout, buf); 

while((c = getchar()) != EOF) 

putchar(c); 

} 

不 对 的 是 ， 这 个 程序 是 错误 的 ， 因 为 一 个 细微 的 原因 。 

要 知道 毛病 出 在 哪 ， 我 们 需要 知道 缓冲 区 最 后 一 次 刷新 是 在 什么 时 候 。 
答案 ; 主 程序 完成 之 后 ， 库 将 控制 交 回 到 操作 系统 之 前 所 执行 的 清理 的 
一 部 分 。 在 这 一 时 刻 ， 绥 冲 区 已 经 被 释放 了 ! 

有 两 种 方法 可 以 避免 这 一 问题 。 

首先 ， 使 用 静态 缓冲 区 ， 或 者 将 其 显 式 地 声明 为 静态 : 

static char buf[BUFSIZ]; 

或 者 将 整个 声明 移 到 主 函 数 之 外 。 


男 一 种 可 能 的 方法 是 动态 地 分 配 缓冲 区 并 且 从 不 释放 它 : 


char *malloc(); 
setbuf(stdout, malloc(BUFSIZ)); 


注意 在 后 一 种 情况 中 ， 不 必 检 查 malloc() 的 返回 值 ， 因 为 如 果 它 失败 
了 ， 会 返回 一 个 空 指针 。 而 setbufO 可 以 接受 一 个 空 指 针 作 为 其 第 二 个 参 
人 


6 预 处 理 器 
运行 的 程序 并 不 是 我 们 所 写 的 程序 ， 因 为 C 预 处 理 器 首先 对 其 进行 了 转 
换 。 出 于 两 个 主要 原因 (和 很 多 次 要 原因 )〉 ， 预 处 理 嚣 为 我 们 提供 了 一 
些 简 化 的 途径 。 


首先 ， 我 们 希望 可 以 通过 改变 一 个 数字 并 重新 编译 程序 来 改变 一 个 特殊 
量 〈 如 表 的 大 小 ) 的 所 有 实例 [9]。 
其 次 ， 我 们 可 能 希望 定义 一 些 东 西 ， 它 们 看 起 来 象 函数 但 没有 函数 调用 
所 需 的 运行 开销 。 例 如 ，putcharO 和 getchar0 通 第 实现 为 宏 以 避免 对 每 
一 个 字符 的 输入 输出 都 要 进行 函数 调用 。 

6.1 宏 不 是 函数 


由 于 宏 可 以 象 函数 那样 出 现 ， 有 些 程序 员 有 时 就 会 将 它们 视 为 等 价 的 。 
因此 ， 看 下 面 的 定义 : 


#define max(a, b) ((a) > (b) ? (a) : (b)) 


注意 宏 体 中 所 有 的 括 写 。 它 们 是 为 了 防止 出 现 a 和 b 是 这 有 比 > 优先 级 低 
的 表达 式 的 情况 。 


一 个 重要 的 问题 是 ， 像 max() 这 样 定义 的 宏 每 个 操作 数 都 会 出 现 两 次 并 
且 会 被 求 值 两 次 。 因 此 ， 在 这 个 例子 中 ， 如 果 a 比 b 大 ， 则 a 就 会 被 求 什 
两 次 : 一 次 是 在 比较 的 时 候 ， 而 男 一 次 是 在 计算 max0 值 的 时 候 。 


这 不 仅 是 低 效 的 ， 还 会 发 生 错误 : 


biggest = x[0]; 

i=1; 

while(i < n) 

biggest = max(biggest, x[i++]); 


当 max0 是 一 个 真正 的 函数 时 ， 这 会 正常 地 工作 ， 但 当 max0 是 一 个 宏 的 
时 候 会 失败 。 壁 如 ， 假 设 x[0] 是 2、x[1] 是 3、x[2] 是 1。 我 们 来 看 看 在 第 


一 次 循环 时 会 发 生 什 么 。 赋 值 语句 会 被 扩展 为 : 
biggest = ((biggest) > (x[i++]) ? (biggest) : (x[i++])); 


首先 ，biggest 与 x[i++] 进 行 比较 。 由 于 i 是 1 而 x[1] 是 3， 这 个 关系 
古 “ 假 "。 其 副作用 是 ，i 增 长 到 2。 


由 于 关系 是 “ 假 ”，x[i++] 的 值 要 赋 给 biggest。 然 而 ， 这 时 的 变 成 2 了 ， 
此 赋 给 biggest 的 值 是 x[2] 的 值 ， 即 1。 


避免 这 些 问 题 的 方法 是 保证 max() 宏 的 参数 没有 副作用 : 


biggest = x[0]; 
for(i= 1; i < n; i++) 
biggest = max(biggest, x); 


还 有 一 个 危险 的 例子 是 混合 宏 及 其 副作用 。 这 是 来 自 UNIX 第 八 版 的 中 
putc0 宏 的 定义 : 


#define putc(x, p) (--(p)->_cnt >= 0 ? (*(p)->_ptrt+ = (xX) : flsbuf(x, p)) 


putc0 的 第 一 个 参数 是 一 个 要 写 入 到 文件 中 的 字符 ， 第 二 个 参数 是 一 个 
指 同 一 个 表示 文件 的 内 部 数据 结构 的 指针 。 注 意 第 一 个 参数 完全 可 以 使 
用 如 *z++ 之 类 的 东西 ， 尺 管 它 在 宏 中 两 次 出 现 ， 但 只 会 被 求 值 一 次 。 
而 第 二 个 参数 会 被 求 值 两 次 (在 宏 体 中 ，x 出 现 了 两 次 ， 但 由 于 它 的 两 
次 出 现 分 别 在 一 个 :的 两 边 ， 因 此 在 putcO 的 一 个 实例 中 它们 之 中 有 且 仅 
有 一 个 被 求 值 ) 。 由 于 putcO 中 的 文件 参数 可 能 带 有 副作用 ， 这 偶尔 会 
出 现 问题 。 不 过 ， 用 户 手册 文档 中 提 到 : “由 于 putc0 被 实现 为 宏 ， 其 对 
待 stream 可 能 会 具有 副作用 。 特 别 是 putc(c，*fF++) 不 能 正确 地 工作 。?” 但 
是 putclxc++, 用 在 这 个 实现 中 是 可 以 工作 的 。 


有 些 C 实 现 很 不 小 心 。 例 如 ,没有 人 能 正确 处 理 putc(*c++, 用 。 男 一 个 例 
子 ， 考 虑 很 多 C 库 中 出 现 的 toupper0O 函 数 。 它 将 一 个 小 写字 母 转 换 为 相 
应 的 大 写字 母 ， 而 其 它 字 符 不 变 。 如 果 我 们 假设 所 有 的 小 写字 母 和 所 有 
(大 小 写 之 间 可 能 有 所 差距 )〉 ， 我 们 可 以 得 到 这 


toupper(c) { 

if(c >= 'aq' && c <= 7) 
c+= "A'-'a’; 

return c; 

} 


在 很 多 C 实 现 中 ， 为 了 减少 比 实际 计算 还 要 多 的 调用 开销 ， 通 常 将 其 实 
现 为 宏 : 


#define toupper(c) ((c) >= 'aq’' && (c) <= 7z' ? (c) + (A'-'a') : (0)) 


很 多 时 候 这 确实 比 函 数 要 快 。 然 而 ， 当 你 试 着 写 toupper(*p++) 时 ， 会 出 
现 奇怪 的 结 


另 一 个 需要 注意 的 地 方 是 使 用 宏 可 能 会 产生 巨大 的 表达 式 。 例 如 ， 继 续 
考虑 max0 的 定义 : 


#define max(a, b) ((a) > (b) ? (a) : (b)) 
假设 我 们 这 个 定义 来 查找 a、b、c 和 d 中 的 最 大 值 。 如 果 我 们 直接 写 : 


max(a, max(b, max(c, d))) 
它 将 被 扩展 为 : 

((@) > (((b) > (((© > (d) ? (© : (dD) ? (Db) : (((O > (d) ? Gd) 
(a@) : (((b) > (((©O > (d) ? (0 : (d)) ? (b) : (0O > (d) ? (0: (d)))) 
这 出 奇 的 庞大 。 我 们 可 以 通过 平衡 操作 数 来 使 它 短 一 些 : 
max(max(a, b), max(c, d)) 


这 会 得 到 : 


(((( > (b) ? (DW: (b> (OO > (0 ?9:4d)? 
(((®Y > (b) ? (@D) : (bW : (9 > (0d ? (0: (4) 
这 看 起 来 还 是 写 : 


biggest = a; 
if(biggest < b) biggest = b; 
ifC(biggest < c) biggest = c; 
if(biggest < d) biggest = d; 
比较 好 一 些 。 
6.2 宏 不 是 类 型 定义 
宏 的 一 个 通常 的 用 途 是 保证 不 同 地 方 的 多 个 事物 具有 相同 的 类 型 : 


#define FOOTYPE struct foo 


FOOTYPE a; 
FOOTYPE pb, c; 


这 人 允许 程序 员 可 以 通过 只 改变 程序 中 的 一 行 就 能 改变 a、b 和 c 的 类 型 ， 
尽管 a、b 和 c 可 能 声明 在 很 远 的 不 同 地 方 。 


使 用 这 样 的 宏 定义 还 有 着 可 移植 性 的 优势 一 一 所 有 的 C 编 译 器 都 支持 
它 。 很 多 C 编 译 右 并 不 文 持 为 一 种 方法 : 


typedef struct foo FOOTYPE; 
这 将 FOOTYPE 定 义 为 一 个 与 struct foo 等 价 的 新 类 型 。 


这 两 种 为 类 型 命名 的 方法 可 以 是 等 价 的 ， 但 typedef 更 灵活 一 些 。 例 如 ， 
考虑 下 面 的 例子 : 


#define T1 struct foo * 


typedef struct foo * 工 2; 


这 两 个 定义 使 得 T1 和 T2 都 等 价 于 一 个 struct foo 的 指针 。 但 看 看 当 我 们 试 
图 在 一 行 中 声明 多 于 一 个 变量 的 时 候 会 发 生 什么 : 


T1 a,b:; 


T2 c, d; 
第 一 个 声明 被 扩展 为 : 
struct foo * a, b; 


这 里 a 被 定义 为 一 个 结构 指针 ， 但 b 被 定义 为 一 个 结构 而 不 是 指针 〉。 
相反 ， 第 二 个 声明 中 c 和 d 都 被 定义 为 指 问 结构 的 指针 ， 因 为 T2 的 行为 好 
像 真 正 的 类 型 一 样 。 


7 可 移植 性 缺陷 


C 被 很 多 人 实现 并 运行 在 很 多 机 器 上 。 这 也 正 是 在 一 个 地 方 写 的 C 程 序 
应 该 能 够 很 容易 地 转移 到 为 一 个 编程 环境 中 去 的 原因 。 


然而 ， 由 于 有 很 多 的 实现 者 ， 它 们 并 不 和 其 他 人 人 交流。 此外， 不 同 的 系 
统 有 不 同 的 需求 ， 因 此 一 台 机 器 上 的 C 实 现 和 男 一 台 上 的 多 少 会 有 些 不 
同 。 


由 于 很 多 早期 的 C 实 现 都 关系 到 UNIX 操 作 系统 ， 因 此 这 些 函 数 的 性 质 都 
是 专 于 该 系统 的 。 当 一 些 人 开始 在 其 他 系统 中 实现 C 时 ， 他 们 演 试 使 库 
的 行为 类 似 于 UNIX 系 统 中 的 行为 。 


但 他 们 并 不 总 是 能 够 成 功 。 更 有 甚 者 ， 很 多 人 从 UNIX 系 统 的 不 同 版 本 
入 手 ， 一 些 库 函 数 的 本 质 不 可 避免 地 发 生 分 歧 。 今天， 一 个 C 程 序 员 如 
As 0 2 
和 差别 。 


7.1 一 个 名 字 中 剖 有 什么 ? 


一 些 C 编 详 器 将 一 个 标识 符 中 的 所 有 字符 视 为 签名 。 而 另 一 些 在 存储 标 
识 符 时 会 忽略 一 个 极限 之 外 的 所 有 字符 。C 编 译 串 产生 的 目标 程序 同 将 
要 被 加 载 器 进行 处 理 以 访问 库 中 的 子 程序 。 加 载 费 对 于 它们 能 够 处 理 的 
名 字 通 第 应 用 上 自己 的 约束 。 


一 个 常见 的 加 载 器 约束 是 所 有 的 外 部 名 字 必 须 只 能 是 大 写 的 。 面 对 这 样 
的 加 载 器 约束 ，C 实 现 者 会 强制 要 求 所 有 的 外 部 名 字 都 是 大 写 的 。 这 种 
约束 在 C 语 言 参 考 手 册 中 第 2.1 节 由 所 描述 。 


一 个 标识 符 是 一 个 字符 和 数字 序列 ， 第 一 个 字符 必须 是 一 个 字母 。 下 划 
线 _ 算 作 字 母 。 大 写字 母 和 小 写字 母 是 不 同 的 。 只 有 前 八 个 字符 是 签 
名 ,但 可 以 使 用 更 多 的 字符 。 可 以 个 多 种 汇编 融和 加 载 器 使 用 的 外 部 标 
识 符 ， 有 着 更 多 的 限制 : 


这 里 ， 参 考 手 册 中 继续 给 出 了 一 些 例 子 如 有 些 实现 要 求 外 部 标识 符 具 有 
单独 的 大 小 写 格 式 、 或 者 少 于 八 个 字符 、 或 者 二 者 都 有 。 

正 因为 所 有 这 些 ， 在 一 个 希望 可 以 移植 的 程序 中 小 心地 选择 标识 符 是 很 
重要 的 。 为 两 个 子 程序 选择 print_fields 和 print_float 这 样 的 名 字 不 是 个 好 
办 法 。 


考虑 下 面 这 个 显著 的 函数 : 


char *Malloc(unsigned n) { 
char *p, *malloc(); 

p = malloc(n); 

if(p == NULL) 

panic("out of memory"); 
return p; 

} 


这 个 函数 是 保证 耗 尽 内 存 而 不 会 导致 没有 检测 的 一 个 简单 的 办 法 。 程 序 
员 可 以 通过 调用 Mallo() 来 代 蔡 malloc()。 如 果 malloc0) 不 幸 失 败 ， 将 调用 


panic0 来 显示 一 个 恰当 的 错误 消息 并 终止 程序 。 

然而 ， 考 虑 当 该 函数 用 于 一 个 忽略 大 小 写 区 别 的 系统 中 时 会 发 生 什 么 。 

这 时 ， 名 字 malloc 和 Malloc 是 等 价 的 。 换 句 话 说 ， 库 函数 malloc0 被 上 面 

的 MallocO 函 数 完 全 取代 了 ， 当 调用 mallocO0 时 它 调用 的 是 它 目 己 。 显 

然 ， 其 结果 就 是 第 一 次 尝试 分 配 内 存 束 会 陷入 一 个 递归 循环 并 随 之 发 生 

混乱 。 但 在 一 些 能 够 区 分 大 小 写 的 实现 中 这 个 函数 还 是 可 以 工作 的 。 
7.2 一 个 整数 有 多 大 ? 


C 为 程序 员 提 供 三 种 整数 尺寸 ， 普通 、 短 和 长 ， 还 有 字符 ， 其 行为 像 一 
个 很 小 的 整数 。C 语 言 定 义 对 各 种 整数 的 大 小 不 作 任何 保证 : 


整数 的 四 种 尺寸 是 非 递 减 的 。 

普通 整数 的 大 小 要 足够 存放 任意 的 数组 下 标 。 

字符 的 大 小 应 该 体现 特定 硬件 的 本 质 。 

许多 现代 机 器 具有 8 位 字符 ， 不 过 还 有 一 些 具 有 7 位 获 9 位 字符 。 因 此 字 
符 通 常 是 7、8 或 9 位 。 

长 整数 通常 至 少 32 位 ， 因 此 一 个 长 整数 可 以 用 于 表示 文件 的 大 小 。 


I 16 位 ， 因 为 太 小 的 整数 会 更 多 地 限制 一 个 数组 的 最 大 
小 。 


短 整 数 总 是 恰好 16 位 。 


在 实践 中 这 些 都 意味 着 什么 ? 最 重要 的 一 点 就 是 别 指望 能 够 使 用 任何 一 
个 特定 的 精度 。 非 正式 情况 下 你 可 以 假设 一 个 短 整 数 或 一 个 普通 整数 是 
16 位 的 ， 而 一 个 长 整数 是 32 位 的 ， 但 并 不 保证 总 是 会 有 这 些 大 小 。 你 当 
然 可 以 用 普通 整数 来 压缩 表 大 小 和 下 标 ， 但 当 一 个 变量 必须 存放 一 个 一 
干 万 的 数字 的 时 候 呢 ? 


一 种 更 可 移植 的 做 法 是 定义 一 个 “新 的 ”类 型 


typedef long tenmil; 


现在 你 束 可 以 使 用 这 个 类 型 来 声明 一 个 变量 并 知道 它 的 冤 度 了 ， 最 坏 的 
情况 下 ， 你 也 只 要 改变 这 个 单独 的 类 型 定义 就 可 以 使 所 有 这 些 变 量具 有 
正确 的 类 型 。 


7.3 字符 是 带 符号 的 还 是 无 符号 的 ? 


很 多 现代 计算 机 支持 8 位 字符 ， 因 此 很 多 现代 C 编 译 器 将 字符 实现 为 8 位 
整数 。 然 而 ， 并 不 是 所 有 的 编译 器 都 按照 同 将 的 方式 解释 这 些 8 位 数 。 


这 些 问 题 在 将 一 个 char 制 转换 为 一 个 更 大 的 整数 时 变 得 尤为 重要 。 对 于 
相反 的 转换 ， 其 结果 却 是 定义 恨 好 的 : 多 余 的 位 被 简单 地 丢弃 把。 但 一 
个 编译 器 将 一 个 char 转 换 为 一 个 int 却 需要 作出 选择 : 将 char 视 为 带 符号 
量 还 是 无 符号 量 ? 如 果 是 前 者 ， 将 char 扩 展 为 int 时 要 复制 符号 位 ; 如果 
是 后 者 ， 则 要 将 多 余 的 位 用 0 填充 。 


这 个 决定 的 结果 对 于 那些 在 处 理 字 符 时 习惯 将 高 位 置 1 的 人 来 说 非常 重 
要 。 这 决定 着 8 位 的 字符 范围 是 从 -128 到 127 还 是 从 0 到 255。 这 又 影响 着 
程序 员 对 哈 希 表 和 转换 表 之 类 的 东西 的 设计 。 


如 采 你 关 必 一 个 字符 值 最 高 位 置 一 时 是 否 被 视 为 一 个 负数 ， 你 应 该 显 式 
地 将 它 声明 为 unsigned char。 这 样 隋 能 保证 在 转换 为 整数 时 是 基 0 的 ， 而 
不 像 普通 char 变 量 那 样 在 一 些 实现 中 是 带 符号 的 而 在 男 一 些 实现 中 是 无 
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符号 的 。 
男 外 ， 还 有 一 种 误解 是 认为 当 c 是 一 个 字符 变量 时 ， 可 以 通过 写 
(unsigned)c 来 得 到 与 c 等 价 的 无 符号 整数 。 这 是 错误 的 ， 因 为 一 个 char 值 
在 进行 任何 操作 (包括 转换 ) 之 前 转换 为 int。 这 时 c 会 首先 转换 为 一 个 
市 符号 整数 再 转换 为 一 个 无 符号 整数 ， 这 会 产生 奇怪 的 结 
正确 的 方法 是 写 (unsigned char)c。 

7.4 右 移 位 是 市 符号 的 还 是 无 符号 的 ? 


这 里 再 一 次 重复 : 一 个 关心 右 移 操作 如 何 进行 的 程序 最 好 将 所 有 待 移 位 
的 量 声明 为 无 符 写 的 。 


7.5 除法 如 何 舍 入 ? 


假设 我 们 用 b 除 a 得 到 商 为 q 余 数 为 r: 

q=a/b; 

r=a%b; 

我 们 暂时 假设 b > 0。 

我 们 期 望 8、b、q 和 r 之 间 有 什么 关联 ? 

最 重要 的 ， 我 们 期 望 g * b +r == a， 因 为 这 是 对 余数 的 定义 。 

如 果 a 的 符号 发 生 改变 ， 我 们 期 望 q 的 符号 也 发 生 改变 ， 但 绝对 值 不 变 。 


我 们 希望 保证 r >= 0 且 r < b。 例 如 ， 如 有 果 余 数 将 作为 一 个 哈 硕 表 的 过 
引 ， 它 必须 要 保证 总 是 一 个 有 效 的 索引 。 


这 三 点 清楚 地 描述 了 整数 除法 和 求 余 操 作 。 不 幸 的 是 ， 它 们 不 能 同时 为 
真 。 


考虑 3 / 2， 商 1 余 0。 这 满足 第 一 点 。 而 -3 / 2 的 值 呢 ? 根据 第 二 点 ， 商 应 
该 是 -1， 但 如 果 是 这 样 的 话 ， 余 数 必须 也 是 -1， 这 违反 了 第 三 点 。 或 
者 ， 我 们 可 以 通过 将 余数 标记 为 1 来 满足 第 三 点 ， 但 这 时 根据 第 一 点 商 
应 该 是 -28 这 又 违反 了 第 三 点 


因此 C 和 其 他 任何 实现 了 整数 除法 舍 入 的 语言 必须 放弃 上 述 三 个 原则 中 
的 至 少 一 个 。 


很 多 程序 设计 语言 放 工 了 第 三 捅 ， 要 求 余 数 的 符 吕 必 须 和 被 除数 相同 。 
这 可 以 保证 第 一 点 和 第 二 点 。 很 多 C 实 现 也 是 这 样 做 的 。 


然而 ，C 语 言 的 定义 只 保证 了 第 一 点 和 |t| < |b| 以 及 当 a >= 0 且 b > 0 时 r >= 
0。 这 比 第 二 点 或 第 三 点 的 限制 要 小 ， 实 际 上 有 些 编译 器 满足 第 二 点 或 
第 三 点 ， 但 不 太 和 常见 《如 一 个 实现 可 能 总 是 问 着 距离 0 最 远 的 方 回 进 行 
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尽管 有 些 时 候 不 需要 灵活 性 ，C 语 言 还 是 足够 可 以 让 我 们 令 除 法 完成 我 
们 所 要 做 的 、 提 供 我 们 所 想 知道 的 。 例 如 ， 假 设 我 们 有 一 个 数 n 表 示 一 
个 标识 符 中 的 字符 的 一 些 函 数 ， 并 且 我 们 想 通 过 除法 得 到 一 个 哈 希 表 入 


品 h， 其 中 0 <= h <= HASHSIZE。 如 果 我 们 知道 np 是 非 负 的 ， 我 们 可 以 简 
单 地 写 : 


h=n% HASHSIZE; 


然而 ， 如 果 n 有 可 能 是 负 的 ， 这 样 写 束 不 好 了 ， 因 为 h 可 能 也 是 猴 的 。 然 
而 ， 我 们 知道 h > -HASHSIZE， 因 此 我 们 可 以 写 : 


h=n% HASHSIZE; 
if(n < 0) 
h += HASHSIZE. 
同样 ， 将 n 声 明 为 unsigned 也 可 以 。 

7.6 一 个 随机 数 有 多 大 ? 
这 个 矿 寸 是 模糊 的 ， 还 受 库 设计 的 影响 。 在 PDP-11[10] 机 左上 运行 的 仅 
有 的 C 实 现 中 ， 有 一 个 称 为 rand0 的 函数 可 以 返回 一 个 〈 伪 ) 随机 非 负 整 
数 。PDP-11 中 整数 长 度 包 括 符号 位 是 16 位 ， 因 此 rand0 返 回 一 个 0 到 215- 
1 之 间 的 整数 。 


当 C 在 VAX-11 上 实现 时 ， 整 数 的 长 度 变 为 32 位 长 。 那 么 VAX-11 上 的 
rand0 函 数 返 回 值 范 围 是 什么 呢 ? 


对 于 这 个 系统 ， 加 利 福 尼 亚 大 学 的 人 认为 rand0 的 返回 值 应 该 涵盖 所 有 
人 因此 它们 的 rand0 版 本 返回 一 个 0 到 231-1 之 间 的 整 


而 AT&I 的 人 则 觉得 如 果 rand0 函 数 仍 然 返 回 一 个 0 到 215 之 间 的 值 则 可 
以 很 容易 地 将 PDP-11 中 期 望 rand() 能 够 返回 一 个 小 于 215 的 值 的 程序 移植 
PVAX TI 
因此 ， 现 在 还 很 难 写 出 不 依赖 实现 而 调用 rand0 函 数 的 程序 。 

7.7 大 小 写 转换 


toupper() 和 tolower() 函 数 有 着 类 似 的 历史 。 他 们 最 初 都 被 实现 为 宏 : 


#define toupper(c) ((C) + 'A' - 'a") 
#define tolower(c) ((C) + 'A' - "al) 


当 给 定 一 个 小 写字 母 作为 输入 时 ，toupper0 将 产生 相应 的 大 写字 母 。 
tolower() 肥 之。 这 两 个 宏 都 依赖 于 实现 的 字符 集 ， 它 们 需要 所 有 的 大 写 
字母 和 对 应 的 小 写字 母 之 间 的 差别 都 是 常数 的 。 这 个 假设 对 于 ASCII 和 
EBCDIC 字 符 集 来 说 都 是 有 效 的 ， 可 能 不 是 很 危险 ， 因 为 这 些 不 可 移植 
的 宏 定 义 可 以 被 封装 到 一 个 单独 的 文件 中 并 包含 它们 。 


这 些 宏 确实 有 一 个 缺陷 ， 即 ， 妆 给 定 的 东西 不 是 一 个 恰当 的 字符 ， 它 会 
返回 垃圾 。 因 此 ， 下 面 这 个 通过 使 用 这 些 宏 来 将 一 个 文件 转 为 小 写 的 程 
序 是 无 法 工作 的 : 


int C; 

while((c = getchar()) != EOF) 
putchar(tolower(c)); 

我 们 必须 写 : 

int C; 

while((c = getchar()) != EOF) 
putchar(isupper(c) ? tolower(c) : C); 


就 这 一 点 ，AT&T 中 的 UNIX 开 发 组 织 提醒 我 们 ， 人 
是 事先 经 过 一 些 适 当 的 参数 进行 测试 的 。 考 虑 这 样 重 写 这 


#define toupper(c) ((C) >= 'a && (cl)<=Z (0) +'A'-'a': (oO)) 


#define tolower(c) ((C) >='A' && (c) <='Z'? (cl+a-A (OO) 


但 要 知道 ， 这 里 c 的 三 次 出 现 都 要 被 求 值 ， 这 会 破坏 如 toupper(*p++) 这 
样 的 表达 式 。 因 此 ， 可 以 考虑 将 toupper0 和 tolowerO 重 写 为 函数 。 
toupper() 看 起 来 可 能 像 这 样 : 


int toupper(int c) { 

if(c >= 'a' && c <= '7") 

retum c+'A'-'a'; 

return C; 

} 

tolower() 类 似 。 

这 个 改变 带 来 更 多 的 问题 ， 每 次 使 用 这 些 函 数 的 时 候 都 会 引入 函数 调用 


开销 。 我 们 的 英雄 认为 一 些 人 可 能 不 愿意 文 付 这 些 开 销 ， 因 此 他 们 将 这 
个 宏 重 命名 为 : 


#define _toupper(c) ((c) + 'A'-'a") 
#define _tolower(c) ((C) + 'a -'A') 
这 束 允 许 用 户 选 择 方便 或 速度 。 


这 里 面 其 实 只 有 一 个 问题 ,伯克利 的 人 们 和 其 他 的 C 实 现 者 并 没有 跟着 
这 么 做 。 这 意味 着 一 个 在 AT&T 系 统 上 编写 的 使 用 了 toupper0 或 
tolower() 的 程序 ， 如 果 没 有 为 其 传递 正确 大 小 写字 母 参数 ， 在 其 他 C 实 
现 中 可 能 不 会 正常 工作 。 


如 果 不 知道 这 些 历史 ， 可 能 很 难 对 这 类 错误 进行 跟 踩 。 
7.8 移 释 放 ， 再 重新 分 配 


很 多 C 实 现 为 用 户 提供 了 三 个 内 存 分 配 函 数 : mallocO0、reallocO 和 
free()。 调 用 malloc(n) 返 回 一 个 指 同 有 n 个 字符 的 新 分 配 的 内 存 的 指针 ， 
这 个 指针 可 以 由 程序 员 使 用 。 给 free() 传 递 一 个 指向 由 malloc0 分 配 的 内 
存 的 指针 可 以 使 这 块 内 存 得 以 再 次 使 用 。 通 过 一 个 指 问 己 分 配 区 域 的 指 
针 和 一 个 新 的 大 小 调用 reallocO 可 以 将 这 块 内 存 扩大 或 缩小 到 新 尺寸 ， 

这 个 过 程 中 可 能 要 复制 内 存 。 


也 许 有 人 会 想 ， 真 相 真 是 有 点 微妙 啊 。 下 面 是 System V 接 口 定 义 中 出 现 


的 对 realloc() 的 摘 述 : 


realloc 改 变 一 个 由 ptr 指 同 的 Size 个 字 节 的 块 ， 并 返回 该 块 〈 可 能 被 移 
1 的 指针 。 在 新 旧 尺寸 中 比较 小 的 一 个 尺寸 之 下 的 内 容 不 会 被 改 


而 UNIX 系 统 第 七 版 的 参考 手册 中 包含 了 这 一 段 的 副本 。 此 外 ， 还 包含 
了 描述 realloc() 的 男 外 一 上 段 : 


如 果 在 最 后 一 次 调用 malloc、realloc 或 calloc 后 释放 了 ptr 所 指向 的 块 ， 
realloc 依 旧 可 以 工作 ;， 因 此 ，free、malloc 和 realloc 的 顺序 可 以 利用 
malloc 压 缩 存 贮 的 查找 沫 略 。 


因此 ， 下 面 的 代码 片段 在 UNIX 第 七 版 中 是 合法 的 : 


free (p); 


p = realloc(p, newsize); 


这 一 特性 保留 在 从 UNIX 第 七 厂 衍 生出 来 的 系统 中 : 可 以 先 释 放 一 块 存 
储 区 域 ， 然 后 再 重新 分 配 它 。 这 意味 看 ， 在 这 些 系统 中 释放 的 内 存 中 的 
内 容 在 下 一 次 内 存 分 配 之 前 可 以 保证 不 变 。 因 此 ， 在 这 些 系统 中 ， 我 们 
可 以 用 下 面 这 种 奇特 的 思想 来 释放 一 个 链表 中 的 所 有 元 素 : 


for(p = head; p != NULL; p = p->next) 


free((char *)p); 

而 不 用 担心 调用 free() 会 导致 p->next 不 可 用 。 

不 用 说 ， 这 种 技术 是 不 推荐 的 ， 因 为 不 是 所 有 C 实 现 都 能 在 内 存 被 释放 
后 将 它 的 内 容 保留 足够 长 的 时 间 。 然 而 ， 第 七 版 的 手册 遗留 了 一 个 未 声 
明 的 问题 : reallocO 的 原始 实现 实际 上 是 必须 要 和 驳 释 放 再 重新 分 配 的 。 

出 于 这 个 原因 ， 一 些 C 程 序 都 是 先 释 放 内 存 再 重新 分 配 的 ， 而 当 这 些 程 
序 移植 到 其 他 实现 中 时 就 会 出 现 问 题 。 

7.9 可 移植 性 问题 的 一 个 实例 


让 我 们 来 看 一 个 已 经 被 很 多 人 在 很 多 时 候 解 决 了 的 问题 。 下 面 的 程序 带 


有 两 个 参数 : 一 个 长 整数 和 一 个 函数 〈 的 指针 ) 。 它 将 整数 转换 位 十 进 
制 数 ， 并 用 代表 其 中 每 一 个 数字 的 字符 来 调用 给 定 的 函数 。 


void printnum(long n, void (*p)()) { 

if(n < 0)1{ 

(*p)(-); 

n= -n; 

} 

if(n >= 10) 

printnum(n / 10, p); 

(*p)(n % 10 + '0"); 

} 

这 个 程序 非常 简单 。 首 先 检 查 n 是 否 为 负数 ， 如 果 是 ， 则 打印 一 个 符号 
并 将 n 变 为 正 数 。 接 下 来 ， 测 试 是 否 n >= 10。 如 果 是 ， 则 它 的 十 进 制 表 
示 中 包含 两 个 或 更 多 个 数字 ， 因 此 我 们 递归 地 调用 printnum(0 来 打印 除 
最 后 一 个 数字 外 的 所 有 数字 。 最 后 ， 我 们 打印 最 后 一 个 数字 。 

这 个 程序 一 一 由 于 它 的 简单 一 一 具有 很 多 可 移植 性 问题 。 首 先是 将 n 的 
低位 数字 转换 成 字符 形式 的 方法 。 用 n % ”10 来 获取 低位 数字 的 值 是 好 
的 ， 但 为 它 加 上 '0 来 获得 相应 的 字符 表示 束 不 好 了 。 这 个 加 法 假设 机 器 
中 顺序 的 数字 所 对 应 的 字符 数 顺 序 的 ， 没 有 间隔 ， 因 此 '0' + 5 和 '5' 的 值 


是 相同 的 ， 等 等 。 尽 管 这 个 假设 对 于 ASCII 和 EBCDIC 字 符 集 是 成 立 
的 ， 但 对 于 其 他 一 些 机 器 可 能 不 成 立 。 避 免 这 个 问题 的 方法 是 使 用 一 个 
表 : 


void printnum(long n, void (*p)()) { 
if(n < 0){ 


Cp)(-); 


n= -0; 
} 

if(n >= 10) 

Printnum(n / 10, p); 
(*p)("0123456789"[n % 10]); 


} 


另 一 个 问题 发 生 在 当 n < 0 时 。 这 时 程序 会 打印 一 个 负 号 并 将 n 设 置 为 - 
n。 这 个 赋值 会 发 生 溢出 ， 因 为 在 使 用 2 的 补 码 的 机 器 上 通常 能 够 表示 的 
负数 比 正 数 要 多 。 例 如 ， 一 个 《长 ) 整数 有 k 位 和 一 个 附加 位 表示 符 
号 ， 则 -2K 可 以 表示 而 2k 却 不 能 。 


解雇 这 一 问题 有 很 多 方法 。 最 直观 的 一 种 是 将 n 赋 给 一 个 unsigned long 
值 。 然 和 而， 一些 C 便 一 起 可 能 没有 实现 unsigned long， 因 此 我 们 来 看 看 
没有 它 怎 么 办 。 


在 第 一 个 实现 和 第 二 个 实现 的 机 器 上 ， 改 变 一 个 正 整数 的 符号 保证 不 会 
发 生 洲 出 。 问 题 仅 出 在 改变 一 个 负数 的 符号 时 。 因 此 ， 我 们 可 以 通过 避 
免 将 n 变 为 正 数 来 避免 这 个 问题 。 


当然 ， 一 旦 我 们 打印 了 负数 的 符号 ， 我 们 就 能 够 将 负数 和 正 数 视 为 是 一 
样 的 。 下 面 的 方法 就 强制 在 打印 符号 之 后 n 为 负数 ， 并 且 用 负数 值 完成 
我 们 所 有 的 算法 。 如 果 我 们 这 么 做 ， 我 们 就 必须 保证 程序 中 打印 符号 的 
部 分 只 执行 一 次 ;一 个 简单 的 方法 是 将 这 个 程序 划分 为 两 个 函数 : 


void printnum(long n, void (*p)O) { 
if(n < 0) { 

(*p)(-); 

printneg(n, p); 

} 


else 

printneg(-n, p); 

} 

void printneg(long n, void (*p)()) { 

if(n <= -10) 

printneg(n / 10, p); 

(*p)("0123456789"[-(n % 10)]); 

} 

printnum() 现 在 只 检查 要 打印 的 数 是 否 为 负数 ;如 果 是 的 话 则 打印 一 个 

符号 。 否 则 ， 它 以 n 的 负 绝 对 值 来 调用 printnegO0。 我 们 同时 改变 了 

printneg() 的 函数 体 来 适应 n 永 远 是 负数 或 零 这 一 事实 。 

我 们 得 到 什么 我们 使 用 n / 10 和 n % 10 来 获取 n 的 前 导数 字 和 结尾 数字 
(经 过 适当 的 符 写 变 换 ) 。 调 用 整数 除法 的 行为 在 其 中 一 个 操作 数 为 负 

的 时 候 是 实现 相关 的 。 因 此 ，n % 10 有 可 能 是 正 的 ! 这 时 ，-(n % 10) 是 

负数 ， 将 会 超出 我 们 的 数字 字符 数组 的 末尾 。 

为 了 解决 这 一 问题 ， 我 们 建立 两 个 临时 变量 来 存放 了 商 和 余数 。 作 完 除法 


后 ， 我 们 检查 余数 是 否 在 正确 的 范围 内 ， 如 果 不 是 的 话 则 调整 这 两 个 变 
量 。printnum0 没 有 改变 ， 因 此 我 们 只 列 出 printneg(): 


void printneg(long n, void (*p)()) { 
long d; 

int T; 

if(r > 0) { 


r -= 10; 


qd+ 十 ; 


} 

if(n <= -10) { 
Printneg(q, p); 

} 
(*p)("0123456789"[-1]); 
} 


8 这 里 是 空闲 空间 
还 有 很 多 可 能 让 C 程 序 员 误 入 迷途 的 地 方 本 文 没 有 提 到 。 如 果 你 发 现 
人 在 以 后 的 版 本 中 它 会 被 包含 进来 ， 并 添加 一 个 表示 感 
谢 的 脚注 。 


参考 


《The C Programming Language》 (Kernighan and Ritchie，Prentice-Hall 
1978) 是 最 具 权 威 的 C 著 作 。 它 包含 了 一 个 优秀 的 教程 ， 面 向 那些 熟悉 
其 他 高 级 语言 程序 设计 的 人 ， 和 一 个 参考 手册 ， 简 洁 地 描述 了 整个 语 
言 。 尽 管 自 1978 年 以 来 这 门 语言 发 生 了 不 少 变化 ， 这 本 书 对 于 很 多 主题 
来 说 仍然 是 个 定论 。 这 本 书 同时 还 包含 了 本 文中 多 次 提 到 的 “C 语 言 参考 
手册 ”。 


《The C Puzzle Book》 (Feuer,， Prentice-Hall, 1982) 是 一 本 少见 的 磨炼 
人 们 文法 能 力 的 书 。 这 本 刷 收 集 了 很 多 谜 题 (和 答案 ) ， 它 们 的 解决 方 
法 能 够 测试 读者 对 于 C 语 言 精妙 之 处 的 知识 。 

《C: A Referenct Manual》 (Harbison and Steele, Prentice Hall 1984) 是 


特意 为 实现 者 编写 的 一 本 参考 资料 。 其 他 人 也 会 发 现 它 是 特别 有 用 的 
一 一 因为 他 能 从 中 参考 细 证 。 


脚注 


1. 这 本 书 是 基于 图 书 《C Traps and Pitfalls》 〈Addison-Wesley，1989， 
ISBN 0-201-17928-8) 的 一 个 扩充 ， 有 兴趣 的 读者 可 以 读 一 读 它 。 


2. 因为 = 的 结果 不 是 1 就 是 0。 

3. 感谢 Guy Harris 为 我 指出 这 个 问题 。 

4. Dennis Ritchie 和 Steve Johnson 同 时 向 我 指出 了 这 个 问题 。 

5. 感谢 一 位 不 知名 的 志愿 者 提出 这 个 问题 。 

6. 感谢 Richard Stevens 指 出 了 这 个 问题 。 

7. 一 些 C 编 译 嚣 要求 每 个 外 部 对 象 仪 有 一 个 定义 ， 但 可 以 有 多 个 声明 。 
使 用 这 样 的 编译 器 时 ， 我 们 何以 很 容易 地 将 一 个 声明 放 到 一 个 包含 文件 
中 ， 并 将 其 定义 放 到 其 它 地 方 。 这 意味 着 每 个 外 部 对 象 的 类 型 将 出 现 两 
次 ， 但 这 比 出 现 多 于 两 次 要 好 。 

8 分离 函数 参数 用 的 喜 号 不 是 逗号 运算 符 。 例 如 在 f(x， 妨 中，x 和 y 的 获 
取 顺 序 是 未 定义 的 ， 但 在 g((x，y)) 中 不 是 这 样 的 。 其 中 g 只 有 一 个 参数 。 
它 的 值 是 通过 对 x 进行 求 值 、 抛 弃 这 个 值 、 再 对 y 进 行 求 值 来 确定 的 。 


9. ”了 预 处 理 器 还 可 以 很 容易 地 组 织 这 样 的 显 式 常量 以 能 够 方便 地 找到 它 
们 。 


10. PDP-11 和 VAX-11 是 数组 设备 集团 (DEC) 的 商标 。 
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